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PALABRAS DE PRESENTACION 


La versión caslellana de la obra del profesor A. G. Kurosch 
«Curso de álgebra superior» que ofrecemos al lector, es el primer libro 
del autor que se traduce al español. 

El conocimiento del álgebra superior es indispensable para la 
formación matemática del estudiante que ha decidido consagrarse 
al estudio de las matemáticas. El presente libro marca un camino 
relativamente corto para pasar del álgebra elemental al estudio de los 
métodos abstractos del álgebra moderna. 

En los primeros capítulos se estudian detalladamente los deter- 
minantes y sistemas de ecua es lineales, se introducen los números 
complejos y las operaciones sobre las matrices, y se hace una exposi- 
ción de la teoría de los polinomios y formas cuadráticas. En los 
capítulos VII y VHI, el autor nos da una idea primordial del álgebra 
lineal. En el capítulo X vemos que el álgebra lineal, el álgebra de los 
polinomios y las funciones racionales pueden generalizarse para el 
caso de un campo fundamental arbitrario. Precisamente en este capí- 
tulo, el autor nos enseña los principios del álgebra moderna. Aquí 
nos encontramos con los conceptos importantes de anillo y campo. 
Estos conceptos permiten exponer con mayor generalidad Ja teoría 
de los polinomios en varias indeterminadas, suponiendo que los 
coeficientes de estos polinomios pertenecen a un campo fundamental 
arbitrario. A continuación, las matrices polinomiales también se 
estudian sobre un campo fundamental arbitrario y se aplican para 
la elaboración de la teoría de las matrices de Jordan. El último capí- 
tulo está dedicado a los grupos; éste es el comienzo de una rama muy 
importante del álgebra moderna, denominada teoría de los 
grupos. 

El autor de este libro es un gran especialista en teoría de grupos. 
Su libro «Teoría de los grupos», desempeñó un papel muy importante 
en el desarrollo de las investigaciones sobre este tema en la Unión 
Soviética. Hace unos años, el prof. A. G. Kurosch publicó una origi- 
nal obra, titulada «Lecciones de álgebra general», que fue favorable- 
mente acogida por los algebristas soviéticos. 

El prof. A. G. Kurosch es jefe de la cátedra de álgebra superior 
de la Universidad de Moscú desde el año 1949. 


8 Palabras de presentación 


El presente libro es un compendio de álgebra superior que compren- 
de los conocimientos de esta ciencia obligatorios para los estudiantes 
de matemáticas de la Universidad de Moscú. Desde la aparición 
de su primera edición en ruso, en el año 1946, ya ha sido reeditado 
ocho veces. En la Unión Soviética éste es uno de los mejores libros 
sobre el tema considerado. Esperamos que tenga buena acogida en los 
países de habla hispánica. 

Agradeceremos al lector sus observaciones sobre la presente tra- 
ducción, que trataremos de tener en cuenta en el futuro. 


Moscú. Febrero de 1968. E. Aparicio Bernardo 


CAPITULO 1 


SISTEMAS DE ECUACIONES 
LINEALES. DETERMINANTES 


$ 1. Método de eliminación consecutiva de las incógnitas 


Comenzamos el curso de álgebra superior con el estudio de los 
sistemas de ecuaciones de primer grado con varias incógnitas o, 
como suele decirse, de los sistemas de ecuaciones lineales *, 

La teoría de los sistemas de ecuaciones lineales origina una am- 
plia e importante rama del álgebra, el álgebra lineal, a la que están 
dedicados una gran parte de los capítulos de este libro y, en particu- 
lar, los tres primeros. Se supone que son reales los coeficientes de las 
ecuaciones que se consideran en estos tres capítulos, los valores de las 
incógnitas y, en general, todos los números que aparecen. En reali- 
dad, todo el contenido de estos capítulos se generaliza, palabra por 
palabra, al caso de ñúmeros complejos arbitrarios, ya conocidos por 
el lector en el curso de la escuela media. 

A diferencia del álgebra elemental, aquí se estudian los sistemas 


con un número arbitrario de ecua incógnitas. Además, supo- 
nemos que el número de ecuacion sistema no coincide con el 
número de incógnitas. 

Sea dado un sistema de s ecuaciones lineales con n incógnitas. 


Convengamos en emplear las siguientes notaciones: las incógnitas las 
designaremos con la letra z con subíndices 1, 2, N: Eys Ear -e ey Bni 
supondremos que las ecuaciones están numeradas así: la primera, 
la segunda, . . ., la s-ésima; el coeficiente de la incógnita z; en la 
i-ésima ecuación, se sel '*; finalmente, el término 
independiente de la ¿ a ecuación se designará con bj. 


que, en la geometría analítica, una ecua- 
as determina una recta en el plano, 
aplearán dos subíndices, el primero de los cuales 
rá el número de la ecuación, y el segundo, el número de la incógnita. Para 
abreviar, estos Índices no se separarán con una coma; claro que, en el caso do 
211, no se debe leer sa once», sino «a uno uno», y en el caso de ag, no se debe 
leor sa treinta y cuatro», cuatro». 


* Esta denominación 
de primer grado con dos ii 
«e Por consiguiente, se 


ci 


indi 
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A A AS 


Los coeficientes se pueden colocar formando un cuadro 


Ossa ++ Un 


denominado matriz de s filas y n columnas; los números ay se llaman 
elementos de la matriz*. Si s = n (o sea, que el número de filas es 
igual al número de columnas), se dice que la matriz es cuadrada y de 
orden n. La diagonal de esta matriz que une el ángulo superior 
izquierdo con el ángulo inferior derecho (o sea, formada por los ele- 
mentos dys, Aza, . -> Gnn), se Mama diagonal principal. Una matriz 
cuadrada de orden n se llamará matriz unidad de orden n, si todos los 
elementos de su diagonal principal son iguales a la unidad, y todos 
los elementos que están fuera de esta diagonal son iguales a cero. 

Se llama solución de un sistema de ecuaciones lineales (1) a un 
sistoma de n números ky, ka, -s ka, en el que cada una de las 
ecuaciones del sistema (1) se convierte en una identidad, después 
de haber sustituido en ella las incógnitas x; por los números corres- 
pondientes ka ¿=4, 2, .... nte. 

Un sistema de ecuaciones lineales puede no tener solución alguna, 
y entonces se llama incompatible, Tal es, por ejemplo, el sistema 


los primeros miembros de estas ecuaciones son iguales, mientras que 
los segundos son distintos. Por lo tanto, ningún sistema de valores 
de las incógnitas puede satisfacer simultáneamente a las dos ecua- 
ciones. 

Si el sistema de ecuaciones lineales tiene solución, se lama com- 
patible. Se dice que un sistema compatible es determinado, si posee 
una solución única (en el álgebra elemental solamente se estudian 


* Do este modo, si la matriz (2) se examina sin relación con el sistema (1, 
el primer subíndico del elemento a;¿ indica el número de su fila, y el segundo, 
el número de su columna. 

** Hay que subrayar, quo los número ky, k 
del sistema y no n soluciones. 


+ kn forman una solución 
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tales sistemas), e indeterminado, si tiene más de una solución. En este 
caso, como veremos más adelante, hay una infinidad de soluciones 
Así, el sistema 

7, } 


es determinado y z, = 1, zs = 3 es una solución. Por el método 
de eliminación de la incógnita, se puede comprobar fácilmente que 
esta solución es única. Por otra parte, el sistema 


3—a=1, y 

6x,—22,=2 
es indeterminado, puesto que tiene infinitas soluciones de la forma 
=k, m=3k-1, (6) 


donde el número k es arbitrario. Con las soluciones obtenidas por las 
fórmulas (3) se agotan todas las soluciones de nuestro sistema. 

El problema de la teoría de los sistemas de ecuaciones lineales 
consiste en la elaboración de métodos que permitan establecer si es 
compatible o no un sistema dado de ecuaciones, y en caso de compa- 
tibilidad, indicar el número de soluciones y señalar un método para 
hallar todas ellas. 

Comenzaremos por el método más cómodo para hallar práctica- 
mente las soluciones de los sistemas con coeficientes numéricos, es 
decir, con el método de eliminación consecutiva de las incógnitas o mé- 
todo de Gauss*. 

Hagamos primero una observación, Á continuación, tendremos 
que hacer las siguientes transformaciones del sistema de ecuaciones 
lineales: ambos miembros de una de las ecuaciones del sistema, 
multiplicados previamente por un mismo número, se van a restar 
de los miembros correspondientes de otra de las ecuaciones del siste- 
ma. Supongamos, por ejemplo, que ambos miembros de la primera 
ecuación del sistema (1), multiplicados por el número c, se restan de 
los correspondientes miembros de la segunda ecuación. Obtendremos 
un nuevo sistema de ecuaciones lineales: 


22m, 


a+ 


anti Hata -+ lta 


ahit + abo 


4) 


QT Asztat a H lanin 


* También se llama método de reducción. (Nota del T.) 
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donde 


—caj para j=1, 


ha — cby 


Los sistemas de ecuaciones (1) y (4) son equivalentes, es decir, son 
simultáneamente incompatibles o son simultáneamente compatibles 
y, en el último caso, poseen las mismas soluciones. En efeclo, sea 
ki ka, |.. ka una solución arbitraria del sistema (1). Es evidente, 
que estos números satisfacen a todas las ecuaciones del sistema (4), 
gunda. Sin embargo, también satisfacen a la segunda 
ecuación del sistema (4): es suficiente recordar que esta ecuación 
se expresa mediante la segunda y la primera de las ecuaciones del 
i a (1). Reciprocamente, toda solución del sistema (4) satisface 
también al sistema (1). En efecto, la segunda ecuación del sistema 
(1) se obtiene restando de ambos miembros de la segunda ecuación 
del sistema (4) los miembros correspondientes de la primera ecuación 
de este sistema, multiplicados por el número —c. 

Es comprensible que, si en el sistema (4) se efectúan unas cuantas 
veces las transformaciones del tipo considerado, el sistema obtenido 
de ecuaciones se mantendrá equivalente al sistema inicial (1). 

Puede ocurrir que después de efectuar tales transformaciones 
aparezca en nuestro sistema una ecuación, cuyos coeficientes en el 
primer miembro sean iguales a cero. Si el término independiente de 
esta ecuación es también igual a cero, la ecuación se satisface con 
cualesquiera valores de las incógnitas. Por lo tanto, suprimiendo 
esta ecuación, llegamos a un sistema de ecuaciones que es equivalente 
al inicial. Si el término independiente de la ecuación considerada es 
diferente de cero, la ecuación no puede ser satisfecha por ninguno 
de los valores de las incógnitas y, por esto, el sistema obtenido de 
ecuaciones, al igual que el sistema inicial equivalente, será incompa- 
tible. 

Expongamos ahora el método de 

Sea dado un sistema arbitrario de ecuaciones lineales (1). Supon- 
gamos para precisar que € Æ 0; claro, puede ocurrir que dy, sea 
igual a cero y, entonces, tendríamos que comenzar por cualquier 
otro coeficiente de la primera ecuación del sistema, diferente de 
cero. 

Transformemos ahora el sistema (1), eliminando la incógnita z, 
de todas las ecuaciones, menos de la primera. Para esto, multipli- 


quemos ambos miembros de la pri cu 


u; 


nera ecuación por y resté- 


moslos de los miembros correspondientes de la segunda ecuación. 

Después, multipliquemos ambos miembros de la primera ecuación por 

a A í E 

as y restémoslos de los miembros correspondientes de la tercera 
$ A 

ecuación, etc., ete. 


$ 1. Método de eliminación consecutiva de las incógnitas 13 


De este modo, obtendremos un nuevo sistema de s ecuaciones 
lineales con n incógnitas: 


anti i yola — (yaa + 


45277 + 02979 + 


a522 + 033%g 


6) 


No tenemos necesidad de escribir explícitamente las expresiones de 
los coeficientes nuevos aí; y de los términos independientes nuevos 
bi, mediante los coeficientes y los términos independientes del siste- 
ma inicial (1). 

Como ya sabemos, el sistema de ecuaciones (5) es equivalente al 
sistema (1). Transformemos ahora el sistema (5). Pero no tocaremos 
más la primera ecuación, y las transformaciones solamente las efec- 
tuaremos con la parte del sistema (5) formada por todas las ecuacio- 
nes, monos la primera. Se sobrentiende que entre ellas no hay ecua- 
ciones cuyos coeficientes de los primeros miembros sean iguales 
a cero: tales ecuaciones las habríamos suprimido, si sus términos 
independientes fuesen iguales a cero, y en caso contrario, quedaría 
ya demostrada la incompatibilidad de nuestro sistema. Por lo tanto, 
hay coeficientes aí; diferentes de cero; supongamos, para precisar, 
que as, + 0. Pransformemos ahora el sistema (5), restando de ambos 
miembros do la tercera ecuación y de cada una de las siguientes ecua- 
ciones, ambos miembros de la segunda ecuación, multiplicados por 


A 


respectivamente. De este modo, quedará eliminada xo de lodas 
las ecuaciones, menos de la primera y de la segunda. Obtendremos 
el siguiente sistema de ecuaciones, que es equivalente al sistema (5), 
y por consiguiente, también al sistema (1): 


anti Mata | gta + 


Nuestro sistema contiene ahora ¢ ecuaciones, £< s, puesto que, po: 
blemente, algunas de las ecuaciones hayan sido suprimidas. Es evi- 
dente que después de eliminar la incógnita 1, puede disminuir el 
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número de ecuaciones del sistema. A continuación, transformaremos 
solamente aquella parte del sistema obtenido que contiene todas las 
ecuaciones, menos las dos primeras. 

¿Cuándo se terminará este proceso de eliminación consecutiva 
de las incógnitas? 

Si llegamos a un sistema tal, en el que una de sus ecuaciones 
tenga un término independiente diferente de cero, mientras que 
todos los coeficientes del primer miembro sean iguales a cero, enton- 
ces, como ya sabemos, nuestro sistema inicial será incompatible. 

En caso contrario, obtendremos el siguiente sistema de ecuaciones, 
equivalente al sistema (1): 


ayt, lo NA A ln = ba 


aña +++ H nt = ds, 


x EAS D e al (6) 
día me aL 
e ar RR ir 


a A 


dista doo HAG, h12 


k-th 


(k-10), 
Akk Ey 


Aquí, an0, ap 0, -o laa A 0, af A 0. Señalemos 
también que Æ < s y, evidentemente, k -< n. 

En este caso, el sistema (1) es compatible. Es determinado para 
k=n, e indeterminado, para k< n. 

En efecto, si k — n, el sistema (6) tiene la forma 


antiga +- Ent 
dirza + 


-H abntn = bh, o) 


De la última ecuación obtenemos un valor absolutamente determi- 
nado de la incógnita z„. Sustituyéndolo en la penúltima ecuación, 
hallaremos un valor unívocamente determinado de la incógnita 
£n-1- Continuando de este modo, hallaremos que el sistema (7), y por 
tanto el sistema (1), poseen solución única, es decir, son compa- 
tibles y determinados. 

Si k < n, tomamos valores numéricos arbitrarios para las incógni- 
tas «independientes» Tati, .. -+ Zn, después de lo cual, avanzando 
por el sistema (6) de abajo arriba hallaremos, como anteriormente, 
unos valores univocamente determinados para las incógnitas Tr, 
Zrii» - + 72, 2,. Como los valores para las incógnitas independien- 
tes se pueden elegir de infinitos modos, el sistema (6) y, por 
consiguiente, el sistema (1), serán compatibles, pero indetermina- 
dos. Es fácil comprobar, que con el método indicado (eligiendo de 
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todos los modos posibles los valores para las incógnitas independien- 
tes), se hallan todas las soluciones del sistema (1). 

A primera vista puede parecer que con el método de Gauss el 
sistema de ecuaciones lineales se puede reducir a otra forma más: 
la que resulta de agregar al sistema (7) unas cuantas ecuaciones que 
contengan solamente a la incógnita z,. Sin embargo, lo que ocurre 
en realidad es que las transformaciones no se han llevado hasta el 
fin: como afín *? 5% 0, se puede eliminar la incógnita zn de todas las 
ecuaciones, comenzando desde la (n -+ 1)-ósima. 

Se debe advertir, que la forma «triangular» del sistema de ecua- 
ciones (7), o Ja forma «trapezoidal» del sistema de ecuaciones (6) 
(para k < n), se obtuvo debido a la suposición de que los coeficien- 
1es dji, 2;,, etc., etc, eran diferentes de cero. En el caso general, el 
sistema de ecuaciones a que llegaremos después de realizar hasta el 
fin el proceso de eliminación de las incógnitas, tomará una forma 
triangular o trapezoidal sólo después de un cambio debido de la 
numeración de las incógnitas. 

Haciendo un resumen de todo lo expuesto anteriormente, llegamos 
a la conclusión de que el método de Gauss se puede aplicar a cualquier 
sistema de ecuaciones lineales. Además, el sistema será incompati- 
ble, si en el proceso de las transformaciones obtenemos una ecuación en 
la que los coeficientes de las incógnitas son iguales a cero, mientras 
que el término independiente es diferente de cero; si no nos encontra- 
mos con tal ecuación, el sistema será compatible. Un sistema compa- 
tible de ecuaciones es delerminado, si se reduce a la forma triangu- 
lar (7), e indeterminado, si se reduce a la forma trapezoidal (6) siendo 
k<n. 

Apliquemos lo expuesto al caso de un sistema de ecuaciones linea- 
les homogéncas, es decir, de ecuaciones, cuyos tórminos independien- 
tes son iguales a cero, Tal sistema siempre es compatible, puesto que 
posee la solución nula (U, D, .. ., 0). Supongamos que en el sistema 
considerado, el número de ecuaciones es menor que el número de 
incógnitas. Entonces, este sistema no podrá reducirse a la forma 
triangular, puesto que en el proceso de transformaciones por el méto- 
do de Gauss, el número de ecuaciones del sistema sólo puede dismi- 
nuir pero no aumentar; por consiguiente, éste se reducirá a la forma 
trapezoidal, es decir, será indeterminado. 

En otras palabras: sí en un sistema de ecuaciones lineales homo- 
géneas, cl número de ecuaciones es menor que el número de incógnitas, 
este sistema, además de la solución nula, poscerá también soluciones 
no nulas, es decir, soluciones, en la os valores de ciertas incó 
nitas (o incluso de todas) serán diferentes de cero; habrá una infinidad 
de soluciones de éstas 

Para la resolución práctica de un sistema de ecuaciones lineales 
por el método de Gauss, se debe escribir la matriz de los cocficientes 
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del sistema y agregarle una columna formada por los términos inde- 
pendientes, separada para mayor comodidad por una raya vertical. 
Todas Jas transformaciones se deben efectuar con las filas de esta 
matriz «ampliada». 

Ejemplos. 1. Resolver el sistema 


21 -+2r2-> 519 


a — 22 1 3rg 


31 —6rp—23= 
Efectuemos las transformaciones en la matriz ampliada del 


i é 5] -9 1 2 5|-9 ts 
( a 3 2) > (e - 2 1) > (0 -3 
3-61] 25 0-12 —16| 52 o 0-8 


Por consiguiente, llegamos al siguiente sistema de ecuaciones: 


5r- —9, 
23 t, 
—8r3: 8, 
que posee la solución únic: 
A ze t, -=i 


nsiguiente, el sistema inicial es determinado. 


Por 
2. Resolver el sistema 
zi- A 
Betra t 
1dz2+2077—9r,= 2. 


Transformemos la matriz ampliada del sistema: 


8413 
a -8l-8|_, 
1 1|-8 
20 -9l 2 
1) 3 /1 8 1j 3 
o —29|160 | [0-89 0 —29|160 
1| -8 o 5 4 1ļ-8 
0 —291 162/ o o o olz 


Hemos llegado a un sistema que contiene la ecuación 0—2. 
Por consiguiente, el sistema inicial es incompatib 
3. Resolver el sistema 


Ary r— 32324 0-0, 
201 +3r94 795240, 
71 —2r3—2r3 | 32,0. 
Esto es un sistema de ecuaciones homogéneas, donde el número de ecuacio- 
nes es menor que el número de incógnitas; por lo tanto, tiene que ser indetormi- 
nado. Como todos los términos independientes son iguales a cero, vamos a trans- 
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formar solamente la matriz de los coeficientes del sistema: 


4 1-34 0 9 5-43 0 2 
£ $ =5) > ( 7 5-41] =>fo0 7 
1-22 3 1 -2 3, 


Homos obtenido el sistema de ecuaciones: 
2a — 20, 
72 +57 —11x¿=0, 
2 —2r3—2x3+ 3x=0. ) 


Cualquiera de las incógnitas zz y z;, se puede tomar como incógnita independien- 
te. Sea z = a; entonces, de la primera ecuación se deduce que zz = a; de la 


segunda ecua 
3 


n obtenemos, zs =-La; y, por fin, de la tercera ecuación, 2, = 


2. Por lo tanto, la forma general de las soluciones del sistema de ecuacio- 
nes dado es: 


a, a. 
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El método de resolución de los sistemas de ecuaciones lineales 
expuesto en el párrafo anterior, es muy sencillo y requiere la real 
zación de cálculos de un mismo tipo, que fácilmente se efectúan en las 
máquinas calculadoras. Sin embargo, su defecto esencial consiste 
en que no da la posibilidad de formular las condiciones de compati- 
bilidad o de determinabilidad de un sistema mediante sus coeficien- 
tes y términos independientes. Por otra parte, incluso en el caso 
de un sistema determinado, con este método no se pueden hallar 
fórmulas para expresar la solución del sistema mediante sus coefi- 
cientes y términos independientes. Sin embargo, estos sistemas en- 
cuentran aplicación en diversas cuestiones teóricas y, en particular, 
en las investigaciones geométricas. De aquí la necesidad de desarro 
Mar la teoría de los sistemas de ecuaciones lineales con otros métodos 
más profundos. El caso gene r estudiado en el capítulo 
siguiente, mientras que el contenido del presente capítulo está dedi- 
cado al estudio de los sistemas determinados que tienen igual número 
de ecuaciones y de incógnitas. Comenzaremos por los sistemas con 
dos y tres incógnitas, ya estudiados en el álgebra elemental. 

Sea dado un sistema de dos ecuaciones lineales con dos incógnitas 


0) 


AZ + ayat2 = by, } 
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cuyos coeficientes forman una matriz cuadrada de segundo orden 


os D 


Mor oz 


Aplicando al si 
obtenemos: 


ema (1), el método de igualación de los coeficientes 


(Artes — 12021) 21 = Diigo — gb, 


(Anan — tän) T2 = ayb — bilar 
Supongamos que anas:+—antn +0. Entonces, 
anhon o 


Sustituyendo en las ecuaciones (1) los valores obtenidos de las incóg- 
hitas, os fácil comprobar que (3) es solución del sistema (1); el proble- 
ma de la unicidad de esta solución se estudiará en el $ 7. 

El común denominador de los valores de las incógnitas (3) está 
expresado sencillamente por los elementos de la matriz (2), o sea, 
es precisamente igual al producto de los elementos de la diagonal 
principal menos el producto de los elementos de la segunda diagonal. 
Este número se llama determinante de la matriz (2). Se suele decir 
que es un determinante de segundo orden, puesto que la matriz (2) 
es de segundo orden. Para designar el determinante de la matriz (2), 
se emplea la siguiente notaci se escribe la matriz (2), pero en lugar 
de los paréntesis se ponen unas barras verticales; de este modo 


an a 
Ea ag [atu (0) 
jemplos. 
37 
1) 4 ¿| =34—7a 
1-2 
2) a |51523511 


Es menester subrayar otra vez más que, mientras la matriz repre- 
senta una tabla de números, el determinante es un número comple- 
tamente determinado por la matriz cuadrada. Señalemos,que los 
productos ajz2 Y asan, se laman términos del determinante de 
segundo orden. 

Los numeradores de las expresiones (3) tienen la misma forma 
que el denominador, o sea, también son determinantes de segundo 
orden: el numerador de la expresión para z, es el determinante de 
una matriz, que se obtiene de la matriz (2) sustituyendo7su primera 
columna por la columna de los términos independientes del sistema 


$ 2. Determinantes de segundo y tercer orden 19 


(1); el numerador de la expresión para zs es el determinante de una 
matriz, que se obtiene de la matriz (2) por la misma sustitución de su 
segunda columna. Las fórmulas (3) se pueden escribir ahora en la 
forma siguiente: 

[Es bi 


dos ba 
z= n= à 5 
x E aj an af © 
an ly Uan ta 


Esta regla de resolución de un sistema de dos ecuaciones lineales 
con dos incógnitas (denominada regla de Cramer) se expresa del modo 
siguiente: 

Si el determinante (4) de los coeficientes del sistema de ecuaciones 
(1) es diferente de cero, la solución del sistema (1) se obtiene tomando 
por valores de las incógnitas las fracciones, cuyo común denominador 
es el determinante (4) y cuyo numerador, para la incógnita z; (i = 1, 2), 
es el determinante que se obtiene sustituyendo en el determinante (4) 
la columna i-ésima (o sea, la columna de los coeficientes de la incógnita 
buscada) por la columna de los términos independientes del siste- 
ma (1). 


Ejemplo. Resolver el sistema 


El determinante de los coeficientes es 
2 4 
g | 1-3 | 
es decir, éste es diferente de cero, por lo cual, se puede aplicar Ja regla de Cra- 


mer al sistema. g i 
Los numeradores para las incógnitas son los determinantes: 


Tal 27 
E |= 19, idem, a | 
Por lo tanto, la solución de nuestro sistema 
di 19 de 


. na 


d 


da= =u. 


2 


La introducción de los determinantes de segundo orden no aporta 
simplificaciones esenciales en la resolución de un sistema de dos 
ecuaciones lineales con dos incógnitas. Sin embargo, los métodos 
análogos para el caso de sistemas de ¿res ecuaciones lineales con tres 


se habla de la sustitución de las 
ón, se va a hablar de un modo seme- 
y columnas del determinante, de sus 


* En este enunciado, para abrevi 
columnas sen el determinante». A cont 
jante, si resulta conveniente, de las filis 
elementos, diagonales, etc. 


2. 
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incógnitas resultan ya prácticamente útiles. Sea dado un sistema 
auty + arata + poza = by, 
Q124 + Gaga + A2373 = Da, (6) 
AzyZ1 + zoo + 3323 = da 


con la matriz de los coeficientes 


Uy Miz tya) 
Mas t dos |. (d) 
Az Mza Uy, 

Fácilmente se comprueba que, si multiplicamos ambos miembros 


de la primera de las ecuaciones (6) por 222433 — 223232, ambos miem- 
bros de la segunda ecuación por 413432 — yoga, ambos miembros 


B 


Fig 1. 


+ 


de la tercera ecuación por 4,2423 — 13%22, Y después sumamos estas 
tres ecuaciones, los coeficientes de z2 y za resultarán iguales a coro, 
es decir, que estas incógnitas se eliminarán simultáneamente, Do este 
modo, obtenemos la igualdad 


(ys lygs + Alasta + Ayalata — Ay — 29437 — Aglaa) T1 = 
= btzatgs + tab + Ar9b 232 — 302209 — 2239 — biđaze (8) 
El coeficiente de z, en esta igualdad se llama determinante de 
tercer orden, correspondiente a la matriz (7). Para escribirlo, se 


emplean los mismos símbolos que en el caso de los determinantes de 
segundo orden; por lo tanto, 


Ay lg Ay 
as laa laz |= 0102957 + yzlty F Ag — 
üs asz los — listats — tatta — Astor) (9) 


A pesar de que la expresión del determinante de tercer orden es 
bastante complicada, la ley de su formación con los elementos de la 
matriz (7) es muy sencilla. En efecto, uno de los tres términos del 
determinante que figuran en la expresión (9) con el signo más es el 
producto de los elementos de la diagonal principal; cada uno de los 
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otros dos, es el producto de los elementos situados en la paralela 
a esta diagonal, por el elemento situado en el ángulo opuesto de la 
matriz. Los términos que figuran en (9) con signo menos, se forman 
del mismo modo, pero con respecto a la segunda diagonal. De este 
modo, obtenemos un método de cálculo de los determinantes de ter- 
cer orden, que conduce (teniendo cierta práctica) a un rápido resul- 
tado. En la fig. 1, en el esquema de la izquierda, se señala la regla 
para el cálculo de los términos positivos del determinante de tercer 
orden, y en el de la derecha, la regla para el cálculo de sus términos 
negativos. 


Ejemplos. 
212 
1) | -4341|=2.3.541-1-242:(—4)-3— 
235| —2-3-2-4(—4)-5-24- 
=30+2—24—12+20—6=10. 
1 0-5 


23| —2 3 2|=1.3-0+0-2-1+(—5):(—2)-(—2)— 
2-2 o| —(-5):3:1-0:(-2:0—1.2.(-2 = 
=—204+1544=-1. 

El segundo miembro de la igualdad (8) es también un determinan- 
te de tercer orden: es precisamente el determinante de la matriz 
que se obtiene de la matriz (7), sustituyendo su primera columna por 
la columna de los términos independientes del sistema (6). Si desig- 
namos con Ja letra d el determinante (9) y con el símbolo d; (j 

2, 3), el determinante que se obtiene de este último, al susti- 
ésima columna por la columna de los términos independien- 
tes del sistema (6), la igualdad (8) toma la forma da, = dy, de don- 
de, para d 0, se deduce que 


a%. (10) 


Del mismo modo, multiplicando las ecuaciones (6) por los núme” 
TOS yla — Anüs Aass — üs@2s, respectiva” 
mente, obtenemos para 22 la siguiente expresión (siendo = 0): 


7-2 (11) 


Finalmente, multiplicando estas ceuaciones por anas: — asāy, 
Ajas — Ajäsr, Aao — Aizaz, respectivamente, llegamos a la 
siguiente expresión para 7z: 


(12) 
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Sustituyendo las expresiones (10), (11) y (12) en la ecuación (6) 
(se sobrentiende que los determinantes d y todos los dy; están escritos 
en forma desarrollada), después de unos cálculos bastante complica- 
dos, pero asequibles, vemos que se satisfacen todas estas ecuaciones, 
es decir, que los números (10) (11) y (12) son la solución del sistema. 
Por lo tanto, si el determinante de los coeficientes de un sistema de 
tres ecuaciones lineales con tres incógnitas es diferente de cero, su 
solución se puede hallar por la regla de Cramer, formulada igualmente 
que en el caso de un sistema de dos ecuaciones. En el $7, el lector halla- 
rá, para un caso más general, otra demostración de esta afirmación 
(que no se basa en los cálculos omitidos), y también la demostración 
de la unicidad de la solución (10) (11) y (12) del sistema (6). 


Ejemplo. Resolver el sistema 


222430, 
342125131, 


4 


tes dol sistema es diferente do cero: 


z, +3r7—223 


El determinante de los coefi 
2-1 


r eso, so le puodo aplicar la regla de Cramer. Los mumeradores para las 


incógnitas son los determinantes 
0-1 1 20 4 
alt 2-5|=43, d=|3 1 -5|=47 
432 14 -2 
2-10 
d=|3 21|=2, 
1 34 
o soa, que la solución del sistema es el sistema de números 
47 2_3 


mg a=: 


$ 3. Permutaciones y sustituciones 


Para definir y estudiar los determinantes de orden n, necesitamos 
unos cuantos conceptos y datos referentes a los conjuntos finitos. 
Sea dado un conjunto finito M, compuesto de z elementos. Estos se 
pueden numerar, empleando para ello los primeros n números natura- 
les 1, 2, n. Como en las cuestiones que nos interesan, las pro- 
piedades individuales de los elementos del conjunto M no van 
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a jugar ningún papel, supondremos simplemente que los mismos núme- 
ros 1, 2, ..., n, representan a los elementos del conjunto M. 

Además de la ordenación normal de los números 1, 2, y RP, 
éstos pueden ser ordenados de muchos modos. Así, los números, 
1, 2, 3, 4 se pueden ordenar también de los modos siguientes: 3,1, 
2, 4, o bien, 2, 4, 1, 3, etc. Toda disposición de los números 1, 2, ...,1 
en un orden determinado, se llama permutación de n números 
(o de n símbolos). 

El número de permutaciones diversas de n simbolos es igual al 
producto 1-2... n, designado por n! (se lee: «factorial de n»). 
En efecto, la forma general de una permutación de n símbolos es 
dk in, donde cada uno de los símbolos ¿, representa uno de 
los números 1, 2, ..., n; además, ninguno de estos números se repite, 
En calidad de ¿, se puede tomar cualquiera de los números 1,2, . . ., n; 
esto ofrece n diferentes posibilidades. Sin embargo, si se ha elegido 
ya i, on calidad de iz se puede tomar solamente uno de los n—4 
números restantes, es decis, que el número de modos de elección de los 
símbolos i, y iz es igual al producto n (n — 1), etc. 

Por lo tanto, el número de permutaciones de n símbolos, para 
n = 2, os igual a 21 = 2 (las permutaciones 12 y 21; en los ejemplos 
donde n < 9, no separaremos con comas los símbolos que se per- 
mutan); Tara n= 3, este número es igual a 3! = 6, para n = 4, 
es igual a 4! = 24. A continuación, con el aumento de n, el número 
do permutaciones crece extraordinariamente; así, para n = 5, es 
igual a 5! = 120, y para n = 10, es ya igual a 3 628 800. 

Si en una permutación cambiamos de lugar dos símbolos cualesquie- 
ra (no necesariamente situados uno al lado del otro), permaneciendo 
todos los demás en sus sitios, obtenemos, evidentemente, una nueva 
permutación. Esta transformación de la permutación se denomina 
trasposición. 

Todas las n! permutaciones de n simbolos se pueden colocar en un 
orden tal, que cada permutación siguiente se obtenga de la anterior 
mediante una trasposición, pudiendo además comenzar por cualquiera 
de ellas. 

Esta afirmación es justa para n = 2: si se pide empezar por la 
permutación 12, la disposición buscada es 12, 21; si se pide empezar 
por la permutación 21, la disposición es 21, 12. Supongamos, que 
nuestra afirmación ya está demostrada para n — 1, y que queremos 
demostrarla para n. Supongamos, además, que tenemos que comen- 
zar con la permutación 

a) 


Consideremos todas las permutaciones de n símbolos en las que i, ocu- 
pa el primer lugar. En total, resultan (z — 1)! permutaciones. 
Según la tesis del teorema, éstas pueden ser ordenadas del modo indi- 
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cado y, además, comenzando por la permutación (1), puesto que, en 
realidad, esto se reduce a la ordenación de todas las permutaciones 
de n — i símbolos y, por la suposición inductiva, se puede comenzar 
por cualquier permutación y, en particular, por la permutación 
ia... in. En la última de las permutaciones de n símbolos obteni- 
das de este modo, efectuamos una trasposición del símbolo i, con 
cualquier otro símbolo, por ejemplo, con i», y comenzando con la 
permutación nueva obtenida, ordenamos del modo necesario todas 
las permutaciones en las que iz ocupa el primer lugar, etc. Es evidente, 
que de este modo se pueden obtener todas las permutaciones de r 
símbolos, 

De este teorema se deduce que de cualquier permutación de n sim- 
bolos se puede pasar a cualquier otra permutación de los mismos sim- 
bolos, mediante unas cuantas traspusiciones. 
dice que, en una permutación dada, los números č y j forman 
una inversión, si ¿> j, pero en esta permutación, į está antes que j. 
Una permutación se llama par, si sus símbolos forman un número 
par de inversiones, e impar, en el caso contrario. Así, la permutación 
1,2, ..., nes par para cualquier z, puesto que en ella el número 
de inversiones es igual a cero. La permutación 451362 (n = 6) con- 
tiene 8 inversiones y, por consiguiente, es par; Ja permutación 
38524671 (n = 8) contiene 15 inversiones y, por consiguiente, es 
impar. 

Toda trasposición cambia la paridad de la permutación. 

Para demostrar este importante teorema, consideremos primero 
ol caso en que los símbolos ¿ y j que se trasponen estén uno al lado 
del otro, es decir, que la permutación tiene la forma..., HRN 
donde los puntos sustituyen a los símbolos que no se alteran con la 
trasposición. Li ción convierte a nuestra permutación en la 
permutación..., j, i, . . -; se comprende, además, que en ambas per- 
mutaciones, cada uno de los símbolos ¿, j, forma unas mismas inver- 
siones con los símbolos que se mantienen en el sitio. Si antes los 
símbolos i y j no formaban inversión, en la nueva permutación apare- 
ce una nueva inversión, o sea, el número de inversiones aumenta en 
una unidad; si antes | mbolos ¿ y j formaban inversión, ésta ahora 
desaparece, o sea, el número de inversiones disminuye en una unidad. 
En ambos casos, cambia la paridad de la permutación, 

Supongamos ahora, que entre los símbolos i y j que se trasponen 
hay intercalados s símbolos, s > 0, es decir, que la permutación 


tiene la forma 
LS 6) 


Se puede obtener la trasposición de los símbolos i y j como resultado 
de la ejecución consecutiva de 2s + 1 trasposiciones de elementos 
vecinos. Estas son, precisamente, las trasposiciones que permutan 
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los símbolos ¿ y k,, a continuación, ¿ (que ya ocupa el lugar del sím- 
bolo k;) y ka, ete, hasta que i llegue a ocupar el lugar del símbolo X,. 
Después de estas s trasposiciones viene la trasposición que permuta 
los símbolos ¿ y j, y luego, s trasposiciones del símbolo j con todos 
los k, a consecuencia de lo cual j ocupa el lugar del símbolo i, mientras 
que los símbolos Æ vuelven a sus lugares antiguos. Por lo tanto, la 
paridad de la permutación fue cambiada un número impar de veces, 
y por esto, la permutación (2) y 


y Ra lis 163) 


tienen diferente paridad. 
Para n > 2, el número de permutaciones pares de n simbolos es 


igual al número de permutaciones impares, es decir, es igual a 2 nt 
p p igual a y 


En efecto, basándonos en lo demostrado anteriormente, ordenemos 
todas las permutaciones de n símbolos de tal modo, que cada una de 
ellas se obtenga de la anterior mediante una traspo; n. Las per- 
mutaciones vecinas tendrán entonces paridad contraria, es decir, las 
permutaciones estarán colocadas de tal manera, que las permutacio- 
nes pares e impares se alternarán. Nuestra afirmación se deduce ahora 
de la observación evidente que para n => 2, el número n! es par. 

Introduzcamos ahora un nuevo concepto, el de sustitución de 
grado n, Escribamos, una debajo de otra, dos permutaciones de n 
símbolos, colocando entre paréntesis las dos filas obtenidas; por 


ejemplo, para n = 5: 
35142 ” 
52344): 00) 


En este ejemplo*, bajo el número 3 figura el número 5, bajo el núme- 
ro 5, el número 2, etc. Diremos que el número 3 se sustituye por el 5 
(o también, que la sustitución transporta el 3 sobre el 5); el número 5, 
por el 2; el número 1, por el 3; número 4, por el 4 (o que se queda 
en el sitio); y, por fin, el número 2, por el 1. Por lo tanto, dos permu- 
taciones, escritas una bajo la otra en la forma (4), determinan una 
aplicación biyectiva** del conjunto de los primeros cinco números 


aspecto, se parece a una matriz de dos filas y 5 columnas, pero 
icado totalmente distinto. 
A continuación se empleará frecuentemente la siguiente terminología, 
admitida en la teoría de conjuntos. 

Sean dados dos conjuntos M y N (finitos 
quier naturaleza. 

Si de un modo determinado, a cada elemento z de M (con la notación 
x € M se denota que el elemento z pertenece a M) so pone en correspondencia 
un elemento y de N (y € N), y sólo uno, se dice que se ha definido una apli- 


finitos) de elementos de cual- 
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naturales sobre sí mismo, es decir, una aplicación que, a cada uno 
de los números naturales 1, 2, 3, 4, 5, pone en correspondencia uno 
de estos mismos números naturales, y que, a diversos números pone 
en correspondencia números diferentes. Como en total hay cinco 
números de éstos, o sea, es un conjunto finito, a cada uno de estos 
números corresponderá uno de los números 1, 2, 3,4, 5, es decir, 
mente el número por el que «se sustituye». 

Está claro, que la aplicación biyectiva del conjunto de los cinco 
primeros números naturales que hemos obtenido mediante (4), se 
podría haber obtenido también escribiendo, una bajo la otra, otr 
pares de permutaciones de los cinco simbolos. Estas expresiones 
obtienen de (4) mediante unas cuantas trasposiciones de las columnas; 
tales son, por ejemplo, 


na rasin 25143 E 
(az sa) 32145) l12345)" 6) 
En todas estas expresiones, 3 se sustituye por 5, 5 por 2, ele. 

De modo análogo, dos permutaciones de n simbolos, escritas una 
bajo la otra, determinan una aplicación biyectiva del conjunto de los 
primeros n números naturales sobre sí mismo. Toda aplicación biyecti- 
va A del conjunto de los primeros z números naturales sobre sí mismo, 


se llama sustitución de grado n. Es evidente, que toda sustitución A 
se puede expresar mediante dos permutaciones, escritas una bajo la 


otra 

a[b te . 

ls, Blas saa a) © 

aquí, mediante a, se denota el número que en la sustitución A susti- 
tuye al número i, i = 1, 2, q, n. 

La sustitución A posee una multitud de expresiones de la forma 
(6). Así, pues, (4) y (5) son diversas expresiones de una misma susti- 
tución de 5° grado. 

Se puede pasar de una expresión de la sustitución A a otra, reali- 
zando unas cuantas trasposiciones de las columnas. También se puedo 
obtoner una expresión de la forma (6), en la que figure, en la fila 
superior (o inferior), una permutación prefijada de n símbolos. En 


cación (o una representación) de M en W. El elemento y se llama en este caso 
imagen o representación de z. 

Si todo elemento de N es imagon de al menos un elemento de M, se dice que 
se tiene una aplicación de M sobre W (pudiendo ser pluriunivoca, cuando varios 
elementos de M tienen una misma imagen). En este caso, la aplicación se llama 
exhaustiva (o sobreyectiva). Si distintos elementos de M tienen distintas imá- 

zenes, la aplicación es inyectiva. Una aplicación exhaustiva e inyectiva se llama 
Biyectiva también suelo. decirse quo entre A7 y N se ha establecido una corres: 
pondencia biunívoca). En este caso, cada elemento y € N es imagen de un 
sólo elemento z€ M. (Nota del T.). 
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A de grado n 


Iaka Mm 


i A 


particular, toda sustituc puede expresar en la 


forma 


o sea, con la ordenación natural de los números en la fila superior, 
Escribiéndolas de este modo, las diversas sustituciones se diferen- 
ciarán unas de otras por las permutaciones que figuran en las filas 
inferiores, con lo que llegamos a la conclusión de que el número 
de sustituciones de grado n es igual al número de permutaciones de n 
símbolos, es decir, es igual a ni. 

Un ejemplo de sustitución de grado n es la sustitución unidad 


(o idéntica) 
18 
( - n) š 


en la que todos los símbolos permanecen en su sitio, 
jeñalemos que, en la expresión (6) de la sustitución A, las filas 
superior e inferior desempeñan papeles diferentes y que, por lo gene- 
ral, cambiándolas de sitio, obtenemos una sustitución diferente, Así 
pues, las sustituciones de 4° grado 
2143) /4312 
AAE 
son distintas: en la primera, el número 2 se sustituye por el 4, mientras 
que en la segunda, por el 3. 

Tomemos una expresión arbitraria (6) de una sustitución A de gra- 
do n. Las permutaciones que forman las filas superior e inferior de 
esta expresión pueden ser de igual paridad o de paridad contraria. 
Como ya sabemos, el paso a cualquier otra expresión de la sustitución 
A se puede realizar mediante la ejecución consecutiva de unas 
cuantas Lrasposiciones en la fila superior y las trasposiciones corres- 
pondientes en la fila inferior. Por otra parte, al efectuar una traspo- 
sición en la fila superior de la expresión (6) y una trasposición de los 
elementos correspondientes en la fila inferior, las paridados de ambas 
permutaciones cambian simultáneamente, 'manteniéndoso así la 
coincidencia o la contrariedad de estas paridades. De aquí se deduce 
que, en todas las expresiones de la sustitución, las paridades de las filas 
superior e inferior coinciden, o bien, en todas estas expresiones, las 
paridades son contrarias. Èn el primer caso, se dice que la sustitución A 
es par, en el segundo, que es impar. En particular, la sustitución 
unidad es par. 

Si la sustitución A está escrita en la forma (7), es decir, que en la 
fila superior figura la permutación par 1, 2, . . ., n, entonces, la paridad 
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de la sustitución A se determinará por la paridad de la permutación 
Qi, Qz, - - -, an que figura en la fila inferior. De esto se deduce que 
el número de las permutaciones pares de grado n es igual al número 


de las impares, es decir, es igual a + nt, 


A la definición de la paridad de las sustituciones se le puede dar 
otra forma un poco diferente. Si en la expresión (6), las paridades 
de ambas filas coinciden, el número de inversiones, o es par en ambas 
filas, o es impar en las dos, es decir, el número total de inversiones 
en las dos filas de la expresión (6) es par; si las paridades de las filas 
de la expresión (6) son contrarias, el número total de inversiones en 
estas dos filas es impar. Por lo tanto, la sustitución A será par, si 
el número total de inversiones en las dos filas de cualquiera de sus 
expresiones es par, e impar, en el caso contrario. 


Ejemplo. Sea dada la sustitución de quinto grado 
E 1452 
25431 
En la fila superior hay 4 inversiones y en la inferior 7. El número total 
de inversiones en las dos filas es igual a 11 y, por consiguiente, la sustitución 


es impar, 
Escribamos esta sustitución en la form 


1234 
( 12 53) s 

1 número de inversiones en la fila superior es O y en la inferior es 5, es decir, 
el número total de inversiones es de nuevo impar. Vemos, pues, que en diversas 
expresiones de la sustitución se conserva la paridad, pero no el mismo número 
total de inversiones. 

Queremos señalar ahora otras formas de definición de la paridad 
de Jas sustituciones que son equivalentes a las expuestas anterior- 
mente*, Para este fin, definiremos el producto de sustituciones (que 
es también de particular interés). Como ya sabemos, la sustitución 
de grado n es una aplicación biyectiva del conjunto de los números 
4, 2, ..., n, sobre sí mismo. El resultado de la realización cons 
cutiva de dos aplicaciones biyectivas del conjunto 1, 2, ..., n 
sobre sí mismo es, evidentemente, una nueva aplicación biyectiva 
de este conjunto sobre sí mismo, es decir, la realización consecutiva 
de dos sustituciones de grado n da lugar a otra sustitución tercera 
de grado n, absolutamente determinada. Esta última se llama pro- 
ducto de la primera de las sustituciones dadas por la segunda. Así, 
sean dadas las sustituciones de cuarto grado 


123 5) 1234 

la 142)” 1342)" 

stas se necesitarán solamente en el capítulo 14 y por esto, en la pri- 
mera lectura, este material se puede omitir. 
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5i 1234 
as=(i1 aa) 


En efecto, en la sustitución A el símbolo 1 se sustituye por el 3, 
pero en la sustitución B el símbolo 3 se sustituye por el 4, por lo 
tanto, en la sustitución AB el símbolo 1 se sustituye por el 4, etc. 

Solamente se pueden multiplicar las sustituciones de un mismo 
grado. Para n > 3, el producto de las sustituciones de grado n no es 
conmutativo. En efecto, para las sustituciones A y B consideradas 
anteriormente, el producto BA tiene la forma 


1123 
a=(3421) 


o sca, la sustitución BA es diferento de la sustitución AB. Para todas 
las n (n > 3) se pueden mostrar ejemplos de este tipo, a pesar de que 
para algunos pares de sustituciones se pueda cumplir eventualmente 
la ley conmutativa. 

El producto de las sustituciones es asociativo, es decir, que se pue- 
de hablar del producto de un número finito cualquiera de sustitucio- 
nos de grado n, tomados (en vista de que no se cumple la ley con- 
mutativa) en un orden determinado. En efecto, sean dadas las susti- 
tuciones A, B y C. Supongamos que en la sustitución A el símbolo 
i, 1<iú<mn se sustituye por el símbolo i»; en la sustitución B, 
el simbolo iz se sustituye por el símbolo ¿, y en la sustitución C, este 
último se sustituye por el símbolo ¿¿. Entonces, en la sustitución AB, 
el simbolo ¿y se sustituirá por el i, en la sustitución BC, el símbolo 
iz so sustituirá por el į. Por consiguiente, en la sustitución (AB)C, 
así como en la sustitución A (BC), el simbolo ¿, se sustituirá por el 
símbolo iz. 

Es evidente, que el producto de cualquier sustitución A por la 
sustitución unidad E, y también el producto de E por A, son iguales 
ad: 


entonces 


AE=EA=A. 


Finalmente, denominaremos inversa de la sustitución A a una 
sustitución del mismo grado A“, que cumpla las condiciones 


ANATA =E. 


Fácilmente se observa que la inversa de la sustitución 


12... 
al ) 
% l An 
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es la sustitución 


2 ita 
ar Dia, 


que se obtiene de la sustitución A, permutando la fila superior con 
la inferior. 

Veamos ahora unas sustituciones de una forma especial, que se 
obtienen de la sustitución unidad E mediante una trasposición 
efectuada en su fila inferior, Tales sustituciones son impares, se 
llaman trasposiciones y tienen la forma: 


donde los puntos suspensivos sustituyen a los símbolos que perma- 
necen en su sitio. Convengamos en designar esta trasposición con 
la notación (i, j). La aplicación de la trasposición de los símbolos 
i, j a la fila inferior de la expresión (7) de una sustitución arbitraria 
A, es equivalente a multiplicar la sustitución A a la derecha por la 
sustitución (8), es decir, por (1, j). Ya sabemos que todas las permu- 
taciones de n símbolos se pueden obtener de una de ellas, por ejem- 
plo, de la permutación 1, 2 n, realizando trasposiciones con- 
secutivas; por eso, toda s ón se puede obtener de la sustitución 
idéntica mediante la rea! n sucesiva de unas cuantas trasposi- 
ciones en la fila inferior, es decir, mediante una multiplicación 
sucesiva por sustituciones de la forma (6). Por consiguiente, se puede 
afirmar (omitiendo el factor E), que toda sustitución se puede repre- 
sentar en forma de un producto de trasposiciones. 

Toda sustitución se puede descomponer de muchas maneras di- 
versas en un producto de trasposiciones. Por ejemplo, siempre se 
pueden agregar dos factores iguales de la forma (i, j) (i, j) que, al 
multiplicarlos, darán las sustitución Æ, es decir, que se eliminan 
mutuamente. Señalemos un ejemplo menos trivial: 


¡e 


(8) 


25431 


El nuevo método de determinación de la paridad de una susti- 
tución se basa en el teorema siguiente: 

En todas las descomposiciones de una sustitución en producto de 
trasposiciones, la paridad del número de estas trasposiciones es la 
misma, y coincide con la paridad de la sustitución misma. 

Así, la sustitución del ejemplo considerado anteriormente es 
impar, como se puede comprobar calculando el número de inversiones. 

El teorema quedará demostrado si se muestra que el producto 
de cualesquiera k trasposiciones es una sustitución, cuya paridad 


) = (12) (15) (34) =(14) (24) (45) (34) (13). 
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coincide con la paridad del número k. Para k = 1 esto es cierto, puesto 
que una trasposición es una sustitución impar. Supongamos que ya 
está demostrada nuestra afirmación para el caso de k — 1 factores, 
Entonces, su validez para k factores se deducirá de que los números 
k — 1 y k son de paridad contraria, y el producto de una sustitución 
(en el caso considerado, del producto de los primeros k — 1 factores) 
por una trasposición es equivalente a la realización de esta traspo- 
sición en la fila inferior de la sustitución, es decir, cambia su paridad, 


Un método muy cómodo de expresión de las sustituciones, que permito 
hallar fácilmente su paridad, es la descomposición en ciclos. Toda sustitución 
de grado n puede dejar en el sitio algunos de los símbolos 1, 2, ..., n, otros, ver- 
daderamente los puede transportar. 

Una sustitución se lama sustitución circular o ciclo si al repetia un 
número suficiente de veces, cada uno de los símbolos que verdaderamente se 
transportan puede ser transportado sobre cualquiera otro de estos símbolos. 
Tal es, por ejemplo, la sustitución de octavo grado 

12345678), 
G 8645273) 


ésta verdaderamente transporta los simbolos 2, 3, 6 y 8, a saber, el simbolo 
2 sobro el 8, el símbolo 8 sobre el 3, el símbolo 3 sobre el 6 y el símbolo 6 de 
nuevo sobre el 
Todas las trasposiciones pertenecen al conjunto de los ciclos. Por analogía 
con la forma abreviada de expresión de las trasposiciones que se había empleado 
anteriormente, para los ciclos so usa la siguiente forma do expresión: los sim- 
bolos que verdadoramente son transportados se escriben entre paréntesis uno 
tras otro, en el mismo orden en quo se sustituyen unos por otros al repetir la 
sustitución; la expresión comienza por cualquiera de los simbolos que verdadera- 
mente se transportan y termina con el símbolo que se transporta sobre el pri 
mero. Así, para el ejemplo indicado anteriormente, esta expresión tieno la forma: 


(2830). 


El número de símbolos que verdadoramento son transportados en el ciclo so 
lama longitud del mismo. 

So dice que dos ciclos de grado n son independientes, si no tienen simbolos 
comunes que verdaderamente sean transportados. Se comprende que, al multi- 
plicar ciclos independientes, el orden de los factores no influye en el resultado. 

Toda sustitución se puede descomponer de modo único en un producto de 
ciclos independientes dos a dos. La demostración de esta afirmación no represen- 
ta dificultad alguna y la om :. La descomposición se realiza del modo 
siguiente: comenzamos por cualquiera de los símbolos que verdaderamente se 
tronsportan y escribimos tras él aquellos símbolos sobre los queéste so transporta 
al repetir la sustitución. Continuamos así, hasta que volvamos a obtener el sim- 
bolo inicial. Después de que «se cierre» este ciclo, comenzamos con uno de los 


símbolos que quedan y que verdaderamente se transportan, obteniendo asi el 
segundo ciclo, ete. 
Ejemplos 
12345 A 
D (351a) = mes. 


5124 
12345678: B 
a (52876143) -050 6907. 
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Recíprocamente, para cada sustitución, dada mediante su descomposición 
en ciclos independientes, se puede hallar una expresión en la forma ordinaria 
{con la condición de que se conozca el grado de la sustitución). Por ejemplo: 
1234567 
3175462)* 


3) (1872) (45) = ( 


si se sabe que el grado de esta sustitución es igual a 7. 

Sea dada una sustitución de grado n, y sea sel númoro de ciclos independien- 
tos en su descomposición, más el número de símbolos que permanecen en su 
sitio*. La diferencia n-s se llama decremento de la sustitución. Es evidente, que 
el decremento es igual al número do los símbolos que vordaderamente se trans- 
Portan, menos el número de ciclos independientes que forman parte de la descom- 
posición de la sustitución. Para los ejemplos 1), 2) y 3), considerados antorior- 
mente, el decremento es igual a 3, 4, y 4, respectivamente. 

La paridad de una sustitución coincide con la paridad del decremento de ella. 

En efecto, todo ciclo do longitud k so puede representar en forma de un 
producto de *— 1 trasposiciones del modo siguiente: 

(igs dan eeen in) = (bgs ia) (io ia) (iso ta) 

Supongamos dada la descomposición de la sustitución A en ciclos independientes. 
Si so descompone cada uno de los ciclos en el producto de las trasposiciones que 
acabamos de indicar, obtendremos la expresión de la sustitución A en forma de 
un producto de trasposiciones. El número de estas trasposiciones será, eviden- 
temente, menor que el número de los símbolos que verdaderamente son trans- 
portados por la sustitución A, en un número igual al número de los cielos indo- 
pondientes en la descomposición de la sustitución. Do aquí se deduce, que la 
sustitución A so puede descomponor on un producto de trasposiciones, cuyo 
número es igual al decremento, Por consiguiente, la paridad de la sustitución 
se determina por la paridad del decremento. 
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Queremos generalizar ahora para el caso de un z arbitrario, los 
resultados obtenidos en el $ 2 para n = 2 y 3. Con este fin, es nece- 
sario definir los determinantes de n-ésimo orden. Sin embargo, es 
imposiblo hacer esto del mismo modo que se introdujeron los deter- 
minantes de segundo y tercer orden, es decir, resolviendo en forma 
general un sistema de ecuaciones lineales, pues, a medida que aumen- 
tase n, los cálculos se harían más y más complicados, y siendo n 
arbitrario, éstos serían prácticamente irrealizables. Procederemos de 
otro modo. Examinaremos los determinantes de segundo y tercer orden 
ya conocidos. Procuraremos establecer una ley general, de acuerdo 
a la cual se expresan estos determinantes mediante los elementos 
de las matrices correspondientes y tomaremos esta ley por definición 
para. el determinante de orden n. Después demostraremos que con 
esta definición sigue cumpliéndose la regla de Cramer. 


* A todo símbolo que se mantiene en su sitio se podía haber puesto en 
correspondencia un «ciclos de longitud 1, es dcir, que en el ejemplo 2), 
indicado anteriormente, se podría escribir: (156) (38) (47) (2). Sin embargo, 
no procederemos de este modo. 
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Recordemos las expresiones de los determinantes de segundo 
y tercer orden: 


TS 
aya. 


— 12421, 


az; a22 
Ai Qiz ly 
Ans Az os |= A112233 + Ay2 ogg -H Ayg 33 — 
Gs Asz a| — Croata — Ayal 24033 — Alyaz. 


Obsérvese que todo término del determinante de segundo orden 
es un producto de dos elementos, situados en diversas filas y en diver- 
sas columnas. Además, todos los productos de este tipo que se pueden 
formar con los elementos de la matriz de segundo orden (en total son 
dos), se han utilizado como términos del determinante. De modo 
semejante, todo término del determinante de tercer orden representa 
un producto de tres elementos, tomados también uno a uno de cada 
fila y de cada columna. Todos los productos de estos se utilizan 
también como términos del determinante. 

Sea dada ahora una matriz cuadrada de orden n 


üs yz + Can 


POA 0) 


Gns Ans -~+ ünn 


Consideremos todos los productos posibles de n elementos de esta 
matriz, situados en diferentes filas y en diferentes columnas, 
o sea, los productos de la forma 
Giay Azaz +++ Anan» (2) 
donde los subíndices Ay, &z, ..., %a forman una de las permutaciones 
de los números 1, 2, ..., n. El número de estos productos es igual 
al número de las diversas permutaciones de z símbolos, es decir, 
es igual a nl. Vamos a tomar todos estos productos por términos del 
futuro determinante de n-ésimo orden, correspondiente a la matriz (1). 
Para determinar el signo con que figura el producto (2) on el 
determinante, observemos que con los subíndices de este producto 
se puede formar la sustitución 


12... p 

¡A E o 

donde i se sustituye por æ;, si el elemento situado en la ¿-ósima fila 
y en la arésima columna de la matriz (1) forma parte del producto 


(2). Examinando las expresiones de los determinantes de segundo 
y lercer orden, observamos que en ellos figuran con signo más los 


3 
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términos cuyos subíndices forman una sustitución par, y con signo 
menos, los términos cuyos subindices forman una sustitución impar. 
Resulta natural conservar también esta ley en la definición del deter- 
minante de n-ésimo orden. 

Por lo tanto, llegamos a la siguiente definición: se Jama deter- 
minante de n-ésimo orden, correspondiente a la matriz (1), a la suma 
algebraica de n! términos, constituida del modo siguiente: son térmi- 
nos de ella todos los productos posibles de n elementos de la matriz, 
tomados uno de cada fila y de cada columna, tomando el término 
con signo más, si sus subíndices forman litución par, y con 
signo menos, en el 

Para escribir el determinante de n- correspondiente 
a la matriz (1) se empleará la notación que se usó en el caso de los 
determinantes de segundo y tercer orden: 


Uy tia Gin 


Aa dor 


+ tan | 0 


üns Anz ++ Ann 


Los determinantes de n-ésimo ordeu, para n = 2 y n = 3, se 
convierten en los determinantes de segundo y tercer orden considera- 
dos anteriormente; para n = 1, es decir, para las matrices const 
tuidas de un sólo elemento, el determinante es igual al elemento mi: 
mo. Sin embargo, por ahora, todavía no sabemos si para n > 3 
pueden utilizar los determinantes de n-ésimo orden para la resolución 
de sistemas de ecuaciones lineales. Esto se mostrará en el § 7; pero 
previamente tenemos que estudiar detalladamente los determinantes 
de n-ósimo orden y, en particular, tenemos que hallar un método 
para su cáleulo, puesto que sería muy difícil calcular los determi- 
nantes partiendo de su definición, incluso para n no muy grandes 

Ahora estableceremos las propiedades elementales de los deter- 
minantes de n-ésimo orden, relativas fundamentalmente a una de las 
dos cuestiones. Por una parte, nos interesarán las condiciones para 
que el determinante sea igual a cero; por otra parte, soñalaremos unas 
transformaciones de la matriz que no alteran a su determinante o que 
proporcionan una alteración de éste, fácilmente calculable. 

Llamaremos transposición de la matriz A a una transformación 
de la misma, según la cual sus filas se sustituyen por sus columnas 
del mismo orden, es decir, el paso de la matriz (1) a la matriz 


Ay an 


An 
a E 6) 


a an 


Gin len >> ünn 
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se puede decir que transponer la matriz (1) es hacerla girar alrede- 
dor de la diagonal principal. Correspondientemente, se dice, que 
el determinante 


Gn an > Ong 


Usa üz.. Ana 0) 


Uin ERTE 


se obtiene transponiendo el determinante (4). 
Propiedad 1. El determinante no varía al transponerlo. 
En efecto, todo término del determinante (4) es de la forma 


Aia, Maz >> Anan (7) 


donde los segundos subíndices forman una permutación de los símbolos 
1, 2 , n, Pero, todos los factores del producto (7) se mantienen 
también en el determinante (6) en diferentes filas y en diferentes 
columnas, es decir, que (7) es también un término del determinante 
transpuesto, Es evidente que lo recíproco también es justo, Por lo 
tanto, los determinantes (4) y (6) están constituidos por los mismos 
términos. El signo del término (7) en el determinante (4) se determina 
por la paridad de la sustituci 


12... 
a a £ (6) 
1 q. An 
en el determinante (6), los primeros subíndices de los elementos 
indican el número de orden de la columna, mientras que los segundos 


subíndices indican el número de orden de la fila. Por consiguiente, 
en el determinante (6) al término (7) corresponde la sustitución 


0 0... A 
e 2...n ). 15) 
Por lo general, las sustituciones (8) y (9) son diferentes, pero, eviden- 
temente, tienen una misma paridad y, por lo tanto, el término (7) 
tiene un mismo signo en ambos determinantes, Por consiguiente, los 
determinantes (4) y (6) representan sumas de términos iguales, toma- 
dos con signos iguales, es decir, son iguales entre sí. 

De la propiedad 1 se deduce que cualquier afirmación sobre las 
filas del determinante es válida también para sus columnas y vicever- 
sa, es decir, en el determinante (a distinción de las matrices), las 
filas y las columnas gozan de los mismos derechos. Partiendo de esto, 
las siguientes ocho propiedades (2-9) se enunciarán y se demostrarán 


solamente para las filas del determinante; las propiedades análogas 
para las columnas no necesitarán una demostración especial. 


ze 
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Propiedad 2. Siuna de las filas del determinante está constituida 
por ceros, el determinante es igual a cero, 

En efecto, supongamos que lodos Jos elementos de la i-ósima 
fila del determinante son iguales a cero. En cada uno de los términos 
del determinante tiene que estar incluido uno de los elementos de la 
i-ósima fila, por lo cual, en nuestro caso, todos los términos del 
determinante son iguales a cero 

Propiedad 3. Si un determinante se obtiene de otro permutando 
dos filas, todos los términos del primer delerminante serán términos 
del segundo, pero con signos contrarios, es decir, al permutar dos 
filas, el determinante sólo cambia de signo. 

En efecto, supongamos que en el determinante (4) se permutan 
sima y la j-ésima filas, i=j, y que todas las demás filas se 
mantienen en su sitio. Obtenemos el determinante 


| 


an aja «on | (0) 


A A E (10) 


Gn Gia +. Cin | (7 


(al margen están señalados los números de las filas). Si 
A A (t) 
es un término del determinante (4), evidentemente, todos sus facto- 
res se mantienen también en el determinante (10) en diferentes filas 
y columnas. Por lo tanto, los determinantes (4) y (10) constan de los 
mismos término: el determinante (4) al término (11) le correspon- 
de la sustitución 


(12... ¿ e] awek 

[ota | an 
mientras que en el determinante (10), la sustitución 

(12... e..10...n 

ear | e 


puesto que el elemento aia, por ejemplo, está ahora en la j-ésima 
fila, pero se mantiene en la «-ésima columna anterior. Sin embargo, 
la sustitución (13) se obtiene de la sustitución (12) mediante una 
trasposición en la fila superior, o sea, tiene paridad contraria. De 
esto se deduce, que todos los términos del determinante (4) forman 
parte del determinante (10), pero con signos contrarios, es decir, los 
determinantes (4) y (10) se diferencian entre sí solamente en el signo. 
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Propiedad 4. Un determinante que tiene dos filas iguales es igual 
a cero. 

En efecto, supongamos que el valor del determinante es igual 
a d y que son iguales entre sí los elementos correspondientes de su 
i-ósima y j-ósima filas (¿+ j). En virtud de la propiedad 3, después 
de permutar estas dos filas, el determinante se hace igual a—d. Sin 
embargo, como las filas que se permutan son iguales el determinante, 
en realidad, no varía, o sea, d = —d; de donde d = 0. 

Propiedad 5. Si se multiplican todos los elementos de una fila 
del determinante por un número k, el mismo determinante queda 
multiplicado por k. 

Supongamos que se han multiplicado por k todos los elementos 
de la i-ésima fila. Cada término del determinante contiene exacta- 
mente un elemento de la ¿-ésima fila. Por lo tanto, todo términc 
adquiere el factor k, es decir, el mismo determinante queda multipli- 
cado por k. 

Esta propiedad también se puede expresar así: el factor común de 
todos los elementos de una fila del determinante se puede sacar fuera 
del signo de éste. 

Propiedad 6. Un determinante que tiene dos filas proporcionales 
es igual a cero. 

Supongamos que los elementos de la ¡-ósima fila del determinante 
se diferencian de los elementos correspondientes de la ¿-ésima fila 
(i j) en un mismo factor k. Sacando este factor común k de la 
j-ésima fila fuera del signo del determinante, obtenemos un deter- 
o con dos filas iguales. Este será igual a cero, por la propie- 

ad 4. 

La propiedad 4, así como la propiedad 2 para n > 1, son, eviden- 
temente, casos particulares de la propiedad 6 (para Æ = 1 y k = 0). 

Propiedad 7. Si todos los elementos de la i-ésima fila de un deter- 
minante de n-ésimo orden representan una suma de dos sumandos: 


aj=bj+0j, j=, 0., R, 
el determinante es igual a la suma de dos determinantes, en los 
que todas las filas, menos la i-ésima, coinciden con las del determinante 
dado, mientras que la i-ésima fila de uno de los sumandos consta de 
los elementos by y la del otro, de los elementos cy. 
Todo término dol determinante dado se puede representar de la 
forma 


Gia ĉa, + ana, = lia aa, --- La, 
10,220, ana, = 10,020, >>> (bo 


- Da, <> Ana, H aja, 


Rouniendo los primeros términos de estas sumas (con los mismos 
signos que tenían los términos correspondientes en el determinante 
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dado), obtenemos un determinante de orden z, que solamente se 
diferencia del dado, en que en la ¿ésima fila, en lugar de los elemen- 
tos aij, figuran los elementos bj. Correspondientemente, los segundos 
sumandos forman un determinante en cuya ma fila figuran los 
elementos cj. Por lo tanto, 


ün Gm + An 


bi-e, by 


Bi Bie sos Già | 


La propiedad 7 se generaliza sin dificultad al caso en que todo 
elemento de la ¿-ésima fila es una suma, no de dos, sino de m suman- 
dos, m>2. 

Se dice que la ¡-ósima fila de un determinante es combinación 
lineal de las demás filas, si para cada fila del número de orden j, 
ij=1,...1—1,144, , n, se puede señalar un número ky 
tal, que multiplicando la j-ésima fila por ky y agregando después 
todas las filas, menos la i-ésima (la suma de las filas se debe entender 
como la suma por separado de los elementos de todas estas filas en 
cada columna), se obtiene la i-ésima fila. Algunos de los coeficientes 
k; pueden ser iguales a cero, es decir, en realidad, la ¿-ósima fila 
es combinación lineal, no de todas, sino de algunas filas restantes. 
En particular, si solamente uno de los coeficientes Ay es diferente de 
cero, obtenemos el caso de proporcionalidad de dos filas. Finalmente, 
si una fila se compone totalmente de ceros, ésta siempre será combi- 
nación lineal de las demás filas: caso en que todos los k, son iguales 
a cero, 

Propiedad 8. Si una de las filas del determinante es combinación 
lineal de las demás, el determinante es igual a cero. 

Sea, por ejemplo, la i-ésima fila, combinación lineal de las otras 
s filas, 1 < s< n — 1. Entonces, todo elemento de la ¿-ósima fila 
será una suma de s términos. Por lo tanto, aplicando la propiedad 7, 
representamos nuestro determinante en forma de una suma de deter- 
minantes, en cada uno de los cuales la ¿-ésima fila será proporcional 
a una de las otras filas. Según la propiedad 6, todos estos determinan- 
tes son iguales a cero; por consiguiente, también será igual a cero 
el determinante dado. 

Esta propiedad es una generalización de la propiedad 6, y, como 
se demostrará en el $ 10, es el caso más general de igualdad a cero 
del determinante. 

Propiedad 9. El determinante no varía si a los elementos de una 
de sus filas se agregan los elementos correspondientes de otra fila, 
multiplicados por un mismo número. 
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Supongamos que a la ¿-ósima fila del determinante d se le agrega 
la j-ésima fila, ji, multiplicada por el número k, es decir, que en 
el nuevo determinante todo elemento de la i-ésima fila tiene la forma 
dis + kaja $= 1, 2, ..., n. Entonces, de acuerdo a la propiedad 7, 
este determinante es igual a la suma de dos determinantes, el pri- 
mero de los cuales es d, mientras que el segundo contiene dos filas 
proporcionales y, por ello, es igual a cero. 

Como el número k puede ser negativo, el determinante tampoco 
variará al restar de una de sus filas otra fila, multiplicada por un 
número. En general, el determinante no varía si a una de“sus filas 
se agrega cualquier combinación lineal de las demás. 


Veamos el siguiente ejemplo. Un determinante se llama antisimétrico, 
us elementos, situados simótricamente respecto de la diagonal principal, se 
diferencian entre sí solamente en el signo, es decir, si para todos i y j se tiene 
an = —a1y; de esto se deduce que para todo ¿ será ay = —ayy = 0, Por lo 
tanto, el determinante tiene la forma 


o an ass.. am 
ag 0 23 ==» Uan 


d=| —ay —% 0 .. am]. 


A] 


Multiplicando cada fila de este determinante por — 1, obtenemos el determinan- 
te transpuesto, que es de nuovo igual a d, de donde, en virtud de la propie- 
dad 5, rosulta: 

(—U"d=d. 
Para n impar, se deduce que: —d = d, es decir, d = 0, Por lo tanto, todo deter- 
minante antisimétrico (o hemisimétrico) de orden impar es igual a cero. 


$ 5. Los menores y sus complementos algebraicos 


Antes se había indicado que sería difícil calcular un determinante 
de n-ésimo grado aplicando directamente su definición, o sea, escri- 
biendo cada vez todos los z! términos, determinando sus signos, etc, 
Existen métodos más sencillos para calcular los determinantes, 
basados en el hecho de que un determinante de orden n se puede 
expresar mediante determinantes de órdenes inferiores. Introduzca- 
mos, con este fin, el siguiente concepto. 

Sea dado un determinante d de orden z. Tomemos un número 
entero k que satisfaga la condición 1 < k < n — 1, y elijamos arbi- 
trariamente en el determinante d, k filas y Æ columnas. Los ele- 
mentos situados en las intersecciones de estas filas y de estas colum- 
nas, es decir, pertenecientes a una de las filas y a una de las columnas 
elegidas, forman, evidentemente, una matriz de orden k. El determi- 
nante de esta matriz se llama menor de orden k del determinante d. 
Se puede decir también que el menor de orden k es el determinante 
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que se obtiene después de suprimir n — k filas y n — k columnas 
en el determinante d. En particular, después de haber suprimido en 
el determinante una fila y una columna, obtenemos un menor de 
orden (n — 1); por otra parte, los mismos elementos del determinan- 


te d por separado representan menores de primer orden. 
Supongamos que en un determinante d de n-ésimo orden se ha 

tomado un menor M de orden k. Suprimiendo las filas y columnas, 

en cuyas intersecciones figura este menor, resulta un menor M’ de 


{n — k)-ósimo orden, denominado menor complementario del menor 
M. Suprimiendo, por el contrario, las filas y columnas en las que 
están situados los elementos del menor M’. obtendremos el menor M. 
Por lo tanto, se puede hablar de un par de menores complementarios 
entre sí del determinante. En particular, el elemento a;; y el menor 
de (n — 1)-ésimo orden que se obtiene suprimiendo en el determi- 
nante la iésima fila y la j-ésima columna, formarán un par de meno- 
res complementarios entre sí. 

Si un menor M de k-ésimo orden está sitnado en la 
di doy +. a in y en las columnas de orden jy, jos +. + Jas entonces, 
denominaremos complemento algebraico del menor M a su menor 
complementario M’, tomado con el signo más o menos, según que 
sea par o impar la suma de los números de orden de todas las filas 
y columnas en las que está situado el menor M, es decir la suma 


Hno a) 


En otras palabras, el complemento algebraico del menor M es el 
número (—1) W. 

El producto de cualquier menor M de l-ésimo orden por su com- 
plemento algebraico en el determinante d es una suma algebraica, 
cuyos sumandos, obtenidos al multiplicar los términos del menor M 
por los términos del menor complementario M’ tomados con el signo 
(—1)'4, son ciertos términos del determinante d, coincidiendo sus 
signos en esta suma con los signos que tienen en el determinante, 

Comenzaremos la demostración de este teorema con el caso en 
que el menor M está situado en el ángulo superior de la izquier 
del determinante: 


filas de orden 


sica Lo Pin 


NT 
E A A 
sann (anns ain 
T Ahen h |Chris h arinn] * 
any sanh (an his + Ann 


es decir, en las filas cuyos números de orden son 1, 2, .. ., k y en 
las columnas que tienen los mismos números de orden. Entonces, 
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el menor M’ ocupará el ángulo inferior de la derecha del determinan- 
te. En este caso, el número są es par: 


=t pittt k=2(142+... k), 


por eso, el mismo menor M” sirve de complemento algebraico para M. 
Tomemos un término arbitrario del menor M 


Arapi (2) 


su signo en M será (—1)', donde ¿ es el número de inversiones 


en la sustitución 
1 2... de 
( e 
% Az... An 


El término arbitrario del menor M’ 


Arata 
1a/U20y 


Gnt prti Aktar para +++ nn (4) 


tiene en éste el signo (—1)”, donde 1 es el número de inversiones 
en la sustitución 

¡ag! 

Pasi Brea ee. Ba)” 


Multiplicando los términos (2) y (4), obtenemos el producto de m 
elementos 


(5) 


Qrajl2ay >> Oral, o Ano (6) 


situados en diferentes filas y columnas del determinante; por con- 
siguiente, éste será un término del determinante d. El signo del 
término (6) en el producto MM” será igual al producto de los signos 
de los términos (2) y (4), o sea, (1) = (—1)'+". Sin em- 
bargo, el término (6) tiene también este mismo signo en el deter- 
minante d. En efecto, la fila inferior de la sustitución 


MA tl is o 


O Az un Brea Base + PBa 


formada por los índices de este término, contiene solamente 1 + l’ 
inversiones, puesto que ningún œ puede formar inversión con nin- 
gún ß: todos los æ no son mayores que k, mientras que todos los $ 
no son menores que k -|- 1. 

De este modo, queda demostrado el caso particular considerado 
del teorema. Pasemos a examinar el caso general. Supongamos que 
el menor M está situado en las filas que tienen los números de orden 
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in y en la 
y hu siendo 


columnas que tienen los números de orden 


pehet O E NA 


alumnas, p nos MHevar el menor M 
da, de modo que no se altere el menor 
trasponemos la irésima fila con la 
(i, — A)-ósima, después, la (iy - 2)-ósima, ete., hasta que la 
¿y:ósima fila ocupe el lugar de la primera; para esto, tendremos que 
trasponer las filas i- 1 veces. Después, trasponemos sucesiva 
mente la ¿s-ésima fila con tot filas situadas sobre ella, hasta 
que so sitúe directamente debajo de la ¡¡-ósima fila, es decir, en 
el sitio que ocupaba gunda fila antes de todas las transforma- 
ciones; como es comprobar, para ello tenemos que trasponer 
las filas is — 2 veces. De modo análogo, trasladamos la ¿¿-ésima fi 
al lugar de la tercera fila, ete., hasta que la ¿,-ósima ocupe el lugar 
de la k-ésima fila. En total, tendremos que efectuar 


DAY (a 


poniendo las filas y 1 
al ángulo superior de la izqu 
complementario. Con es 


at ted 


trasposiciones de las filas. 

El menor M ya está situado en las primeras Æ filas del nuevo 
determinante. Ahora trasponemos sucesivamente las columnas del 
determinante: la jy-ésima con todas las precedentes hasta que ocupe 
el primer lugar, después, la jg-ésima, hasta que ocupe el segundo 
lugar, ote. En total, 


Utd 


A A HA) 
veces, 

Después de todas estas transformaciones logamos a un deter- 
minante nuevo d’, en el cual, el menor J ocupa el ángulo superior 
de la izquierda, Como habíamos traspuesto cada vez solamente las 
filas y columnas contiguas, no sufrirá ninguna alteración la colo- 
cación mutua de las filas y columnas que contenían el menor M’ 
en el determinante d. Por lo tanto, el menor 17” se mantiene también 


como menor complementario del menor Af en el determinante d’, 


ocupando ya, sin embargo, el ángulo inferior de la derecha. Como 
hemos demostrado, el producto MM” es una suma de cierto número 
de términos del determinante d’, tomados con los mismos signos que 
tenían en d'. No obstante, el determinante d' se ha obtenido del 
determinante d mediante 


a A] 
Witt) 1424... A)! 


aw 24124 
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trasposiciones de las filas y columnas. Por ello, como sabemos 
por el párrafo anterior, los términos del determinante d' sola- 
mente se diferencian de los términos correspondientes del deter- 
minante d en el signo (—1)'% (se comprende que el número par 
2(1+2 +... +k) no influye en el signo). De aquí se deduce 
que el producto (—1)'MMM” se compone de una cierta cantidad 
de términos del determinante d, tomados con los mismos signos que 
tenían en este determinante. De esta manera, el teorema queda 
demostrado. 

Obsérvese que si los menores M y M’ son complementarios 
entre sí, los números sar Y Syy: son de una misma paridad. En efecto, 
el número de orden de cada fila y de cada columna está incluido 
como sumando en uno, y sólo en uno, de estos números. Por con- 
siguiente, la suma sap + Sa- es igual a Ja suma de los números de 
orden de todas las filas y columnas del determinante, es decir, es 
igual a la paridad del número 2(14+2 +... | n). 


$ 6. Cálculo de determinantes 


Los resultados del párrafo anterior ofrecen la posibilidad de 
reducir el cálculo de un determinante de n-ésimo orden al cálculo 
de unos cuantos determinantes de (n — 1)-ésimo orden. Introduzca- 
mos, primero, las siguientes notaciones: si asy es un elemento del 
determinante d, designaremos con My, el menor complementario, 
o abreviando, el menor de este elemento, es decir, el menor de 
(n — 1)-ésimo orden obtenido después de suprimir la i-ósima fila y la 
j-ésima columna en el determinante. Designaremos con Ay, el com- 
plemento algebraico del elemento ajj, 


Ay= (4 Mu- 


Como se ha demostrado anteriormente, el producto ajA; re- 
presenta una suma de unos cuantos términos del determinante d, 
incluidos en esta suma con los mismos signos que tenian en el deter- 
minanto d. Es fácil calcular el número de estos términos: es igual 
al número de términos en el menor M;;, es decir, es igual a (2 — 1)! 

Elijamos ahora una fila ¿ésima cualquiera del determinante d 
y tomemos el producto de cada elemento de esta fila por su comple- 
mento algebraico: 


anA Gredias -+s GinAin: (1) 


Ningún término del determinante d puede estar incluido en dos 
productos diferentes (1): todos los términos del determinante inclui- 
dos en el producto 2:14 ¿, contienen el elemento a;, de la i-ésima fila, 


44 Cap. 1 Sistemas de ecuaciones lineales. Determinantes 


Por ello, se diferencian de los términos que forman parte del producto 
iz 412, que contienen el elemento a;» de la ¿ésima fila, etc. 

Por otra parte, el número total de términos del determinante d, 
incluidos en todos los productos (1), es igual a 


(n—1)ln=n!. 


Con éstos se agotan por completo todos los términos del determinan- 
te d, Por lo tanto, hemos demostrado que se verifica el siguiente 
desarrollo del determinante d por los elementos de la iésima fila: 


d= annt tiA d+ CinÁin, (2) 


lo que significa que el determinante d es igual a la suma de los pro- 
ductos de todos los elementos de una fila arbitraria de él por sus com- 
plementos algebraicos. Se puede obtener un desarrollo análogo del 
determinante por los elementos de cualquiera de sus columnas. 

Sustituyondo en el desarrollo (2) los complementos algebraicos 
por los menores correspondientes con los signos más o menos, reduci- 
remos el cálculo del determinante de 2r-ésimo orden al cálculo de unos 
cuantos determinantes de (».-1)-ésimo orden. Obsérvese que si algunos 
de los elementos de la ¿-ésima fila son iguales a cero, no habrá que 
calcular, naturalmente, sus menores correspondientes. En virtud 
de esto, es conveniente transformar previamente el determinante, 
aplicando Ja propiedad 9 (véase el $ 4), para que en una de las filas 
o de las columnas haya un número suficientemente grande de ele- 
mentos sustituidos por ceros. En realidad, la propiedad 9 da la po: 
bilidad de sustituir por ceros todos los elementos, menos uno, de cual- 
quier fila o de cualquier columna. En efecto, si aix 0, cualquier 
elemento ajj, j Æ k, de la ¡-ósima fila quedará sustituido por cero 
después de restar de la j-ésima columna la k-ésima columna multipli- 


cada por 2. De este modo, el cálculo de un determinante de n- 


ésimo orden se puede reducir al cálculo de un solo determinante 
de (n — 1)-ósimo orden. 


Ejemplos. 
4. Calcular el determinante de cuarto orden 


3 t~i 2 
-5 1 3—4 
2 0 1-1 
1-5 3-3 


d 
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Desarrollémoslo por los elementos de la tercera fila, aprovechando la exis- 
tencia de un cero: 


11 2 


as{—1)*2| 1 3-4 


3 


it —1 
Hoyas] E 
5 3 


Calculando los determinantes obtenidos de tercer orden, obtenemos: 
d=210—40-1-48=40. 


2. Calcular el determinante de quinto orden 


Agregando a Ja segunda fila la quinta, multiplicada por tres, y restando 
do la cuarta fila la quinta, multiplicada por cuatro, obtenemos: 


-2 5 0-4 3 
1-9 0 83 7 

a 3—1 0 5 —=5 
2 18 e E n 
Dai 2 3 


Desarrollando este determinante por los elementos de la tercera columna, que 
contiene solamente un elemento diferente de cero (con la suma de Índices 54 3, 
es decir, par), obtenemo: 


—2 5 -—t 3 
1-9 43 7 
A A Et 
2 48 7-40 


d- 


Transloramos de nuevo el determinante obtenido, agregando a la primera 
Tila la segunda, multiplicada por dos, restando de la tercera fila la segunda, 
multiplicada por tros, y de la cuarta, la segunda multiplicada por dos: 


0-13 25 17 
1-9 3 7 
o 26 —34 —26 
0 36 —33 —2%4 
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Despuós, desarrollamos ésto por los elementos de la primera columna, teniendo 

además en cuenta, que al único elemento de esta columna, diferente de cero, lo 
corresponde una Suma impar de Índices. Resulta: 
43 25 47] 

d=| 2% 34 

36 —33 


Calculemos esto determinante de tercer orden, desarrollándolo previamente 


por los elementos de su tercera fila: 
g 25 17 —13 —13 25 
Fin de | 26 z -a |7 


— 36. (—72) — (— 33): (— 104) 


)- (— 208) = — 1032. 


3. Si todos los elementos de un determinante, situados a un lado de la diago- 
nal principal, son iguales a cero, el determinante es igual al producto de los ele- 
mentos situados en la diagonal principal. 

Para un determinante de segundo orden, esta afirmación es evidente. Por 
ello, la vamos a demostrar por el método de inducción; supongamos que está 
demostrada ya para los determinantes do (n-1)-ósimo orden. Consideremos el 
determinante do n-ósimo orden: 


Git Oya ig + Ajn 
O an ay: den 
dej 0 0 ag... an |. 


0 0... an 


Desarrollándolo por los elementos de la primera columna, obtenemos 


Aa az 00. an 
$ soso han 


Al menor que figura en el segundo miembro se le puede aplicar la hipótes 
de inducción, es decir, es igual a ass 433... anni de donde 


d=ayonin. 


4. So llama determinante de Vandermonde al siguiente: 
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Demostiomos que para cualquier n el determinante de Vandermonde es, igual 
al producto de todas las diferencias posibles a; — aj, donde 1<j<i<mn. 
En efecto, para n = 2, so tiene 


Supongamos que nuestra afirmación está demostrada ya para los determinantes 
de Vandermonde de (n—1)-ésimo orden. Transformemos el determinante d del 
modo siguiente: de la n-ésima (la última) fila restamos la (n—41)-ésima, multipli- 
cada por ay; después de la (n —41)-ósima restamos la (n — 2)-ésima, multipli- 
cada también por ay, etc., finalmente, de la segunda fila restamos la primera, 
multiplicada por ay, Obtenem: 


1 1 1 š 1 


Desarrollando este determinante por los elementos do la primera columna, Ile- 
amos a un determinante de (n — 1)-ósimo orden; después de sacar fuera deb 
g eeen todos los factores comunes de todas las columnas, ésto toma 
a forma: 


t 1 í 

ER r 

d={az—a;) (a3—a) +0. (ana) F ai a ah 
na ami 


agm? agm? a 


1 es el determinante de Vandermonde do (n — 1)-ésimo orden que, 
¡ón hecha, es igual al producto de todas las diferencias a; — a, 
para 2 <j <4 <n. Por co uiente, empleando el símbolo II para indicar 
el producto, se puede escribi 


d= (aņ—a;) (a3—a4) ... (an— a4) (a—a)= (aa). 
Ple o EE EA 
Del mismo modo so puedo demostrar que el determinante 


d q a a 
a a a an 


es igual al producto de todas las diferencias posibles a;—aj, donde 
1<i< j <n, es decir, 


d'= I (aa). 


teicion 
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Generalizando los desarrollos del determinante por los elementos 
de una fila o columna, obtenidos anteriormente, demostraremos el 
siguiente teorema del desarrollo del determinante por los menores 
de unas cuantas filas o columnas. 

Teorema de Laplace. Supongamos que en un determinante d de 
orden n se han elegido arbitrariamente k filas (o k columnas), 1 < 
<k<»n— 1. Entonces, la suma de los productos de todos los meno- 
res de k-ésimo orden, contenidos en las filas elegidas, por sus comple- 
mentos algebraicos es igual al determinante d. 

Demostración. Supongamos que en el determinante d se han ele- 
gido las filas, cuyos números de orden son iy, da, . i., dy. Sabemos 
que el producto de cualquier menor M de k-ésimo orden, situado 
en estas filas, por su complemento algebraico consta de cierta can- 
tidad de términos del determinante d, tomados con los mismos 
signos que tenían en el determinante. Por consiguiente, el teorema 
quedará demostrado, si demostramos que haciendo recorrer a M 
todos los menores de A-ésimo orden, situados en las filas elegidas, 
obtenemos todos los términos del determinante, no encontrándose 
ninguno de ellos dos veces. 

Sea 


Ajay s. Ana, (3) 


un término arbitrario del determinante d. Tomemos aparte el pro- 
ducto de los elementos de este término, pertenecientes a las filas 
elegidas, y cuyos números de orden son is, iz ..., in Esto será 
el producto 


; 4 


k factores de este producto están en k columnas diferentes, precisa- 
mente en las columnas con los números de orden %;, Ay, > + ++ Upa 
Por consiguiente, estos números de orden de las columnas se deter- 
minan por el término (3). Si designamos con M el menor de k-ésimo 
orden, situado en la intersección de las columnas que tienen estos nú- 
meros de orden %;,, “iy. - -» Qip, Y de las filas elegidas anterior- 
mente, con los números de orden ¿y, iz, . . ., in, el producto (4) será 
uno de los términos del menor M. El producto de todos los elementos 
del término (3), no incluidos en (4), será un término de su menor 
complementario. Por lo tanto, todo término del determinante forma 
parte del producto de un menor determinado de A-ésimo orden situado 
en las filas elegidas por su menor complementario, y además es un 
producto de unos términos determinados de estos dos menores, Final- 
mente, para obtener el término tomado del determinante, con el 
mismo signo que tiene en el determinante, no queda más que susti- 
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tuir el menor complementario por el complemento algebraico. Con 
esto termina la demostración del teorema. 

Se podía haber demostrado el teorema de otro modo. A saber: 
el producto de cualquier menor M de A-ésimo orden, situado en 
las filas elegidas, por su complemento algebraico, consta de kt 
(n — k)! términos. Esto es debido a que el menor M de k-ésimo orden 
se compone de k! términos, y su complemento algebraico, diferen- 
ciándose posiblemente solamente en el signo del menor de orden n—k, 
contiene (r — k)! términos. Por otra parte, el número de menores 
de k-ésimo orden, contenidos en las filas que hemos elegido, es igual 
al número de combinaciones de n sobre k, es decir, es igual al número 

n! 
k! (n—k)! * 


Multiplicando, obtenemos que la suma de los productos de todos 
los menores de k-ésimo orden de las filas elegidas, por sus comple- 
mentos algebraicos, consta de n! sumandos. Sin embargo, éste es 
también, el número total de términos del determinante d. Por con- 
iguiente, el teorema quedará demostrado, si demostramos que 
cualquier término del determinante d está incluido por lo menos 
una vez (y entonces, será una vez, exactamente) en la suma consi- 
derada de productos de menores por sus complementos algebraicos. 
Para esto no le queda más al lector que repetir (con ciertas simplifi- 
caciones) los razonamientos expuestos en la demostración precedente. 

El teorema de Laplace permite reducir el cálculo de un deter- 
minante de n-ésimo orden al cálculo de unos cuantos determinantes 
de órdenes Æ y n — k. Resultará que habrá muchos determinantes 
nuevos de éstos y, por lo tanto, ne sentido aplicar el teorema 
de Laplace solamente en el caso en que se puedan elegir en el deter- 
minante k filas (o column de modo que muchos de los menores 
de k-ósimo orden situados en estas filas sean iguales a cero. 


Ejemplos. 
1. Sea dado un detern 
filas y últimas n — % colum 


ante, cuyos elementos situados en las primeras k 
son iguales a cero: 


a. e ag o 

an anh 

Gherar Reg Ahyi Apt ot haton 
an >s dnk Ong e Ann 


Este doterminante es igual al producto de dos de sus menores: 


Git ss Ayh | | akts kat +++ Oo 


a 


Ori > anh || Gn kgg ++ Ann 
4-252 
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Para la demostración es suficiente desarrollar el determinante por los meno- 

res de las primeras k filas. 
2. Sea dado un determinante d de orden 2n, en cuyo ángulo superior de la 
izquierda figura un menor formado totalmente por ceros. Si los menores de 
-ésimo orden, situados en los ángulos superior de la derecha, inferior de la 
izquierda e inferior de la derecha del determinante, se designan con M, M’ y M” 
rospectivamente, es desir, que el determinante d se puede escribir simbòlica- 
o M 


mente en la forma d 


Para la demostració 
filas y observamos que 


DERG 


su (ti 


es decir, sar y » Lienen una misma parida 
3. Calcular el determinante 


—4 -2 ı 
o 1-5 

d 2 —3 41 
1 1.0 

o a Ñ 


Desarrollándolo por los menores 


Primera y tercera columnas, que 
contienen ceros colocados adecua 


obtenemos: 


aapea] 


osea] 7 


i 
cora] 21 


1 
4 2 


=(—8)-(—20) — (—10)-(— 62) —7-87= — 1069, 
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La teoría de los determinantes de n-ésimo orden expuesta 
anteriormente, permite mostrar que estos determinantes, introducidos 
solamente por analogía con los determinantes de segundo y tercer 
orden, pueden ser utilizados del mismo modo que estos últimos para 
la resolución de sistemas de ecuaciones lineales. Sin embargo, pri- 
mero haremos una observación complementaria, ligada con los 
desarrollos de los determinantes por los elementos de una fila o colum- 
na; en adelante, esta observación va a ser empleada a menudo. 
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Desarrollemos el determinante 


ima columna: 
Aj Ary + azyAzj +... +anjAnjy 


por la j 


y sustituyamos después en este desarrollo los elementos de la 
j-ésima columna por el sistema de z números arbitrarios bj, 
bas...» Dn. La expresión 
bAt bAs + -+ BnÁny, 

representa el desarrollo por los elementos de la j-ésima columna 
del determinante 

P PENTE IEY FN 

PAT 


t=” maes 


E OD 


n | 


obtenido del determinante d sustituyendo su j-ésima columna por 
la columna de los números bi, bz, . . ., ba. En efecto, la sustitución 
de la j-ésima columna del determinante d no afecta a los menores 
de los elementos de esta columna y, por lo tanto, no afecta a sus 
complementos algebraicos. 


Apliquemos esto al caso en que en Ingar de los números 
bj, ba, . . ., bn se toman los elementos do la k-ésima columna del 


determinante d para k+ j. El determinante que se obtiene después 
de esta sustitución contendrá dos columnas iguales (la ¡-ésima 
y la k-ésima) y, por eso, será igual a cero. Por consiguiente, será 
igual a cero también el desarrollo de este determinante por los 
elementos de su j-ésima columna, es decir, 


A Ay] amA ho. Ann An 0 para ¡ho 


Por lo tanto, la suma de los productos de todos los elementos 
de una columna del determinante por los complementos algebraicos 
de los elementos correspondientes de otra columna es igual a cero. 
Naturalmente, este resultado es válido también para las filas del 
determinante. 

Pasemos a estudiar los lemas de ecuaciones lineales, Por 
ahora nos limitaremos al caso de sistemas en los que el número de 


ee 
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ecuaciones es igual al número de incógnitas, o sea, a los sistemas 
de la forma 


anzit A ON 


day, + rata amän = da, 
ati an a 


Anty + paa - - Ts 


bn. 


Además, supondremos que el determinante d de los coeficientes 
de las incògnitas del sistema, denominado abreviadamente deter- 
minante del sistema, es diferente de cero. En estas condiciones 
demostraremos que el sistema (1) es compatible e incluso deter- 
minado. 

En el § 2, al resolver u 
incógnitas, multiplicábamos € 


sistema de tres ecuaciones con tres 
ada una de las ecuaciones por cierto 
factor y después sumábamos ecuaciones, resultando iguales 
a cero los coeficientes de dos de las tres incógnitas. Ahora vemos 
claramente que los factores que empleábamos eran los complementos 
algebraicos en el determinante del sistema, del elemento que 
en la ecuación dada es coeficiente de la incógnita buscada. e 
mismo método se va a emplear para la resolución del sistema (1). 

Supongamos primero que el sistema (1) es compatible y que 
Ga, o, +. ., % es una de sus soluciones. Por consiguiente, se cum- 
plen las igualdades 


Apy- yo «+ H nn = Ds, 
ayt Er 


pe e 
Any F Ana + 

Sea j cualquiera de los números 1, 2, . . ., n. Multipliquemos 
ambos miembros de la primera de las igualdades (2) por As;, 
es decir, por el complemento algebraico del elemento a,, en el deter- 
minante d del sistema; ambos miembros de la segunda igualdad, 
por A», etc., y finalmente, ambos miembros de la última, por Any. 
Sumando después por separado los primeros miembros y los segun- 
pos miembros de todas estas igualdades, llegamos a la siguiente 
igualdad: 


(01 Aj + anA + - - - + anAns) + 
+ (aA + andat >>> F rn) 04 A 


=b,A + bA + - > -bnAnj- 
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El coeficiente de œ; en esta igualdad es igual a d, mientras que, 
en virtud de la observación hecha anteriormente, los coeficientes 
de los demás a son iguales a cero; el miembro independiente es igual 
al determinante que se obtiene del determinante d después de sus- 
tituir en él la j-ésima columna por la columna de los términos inde- 
pendientes del sistema (1). Si designamos este último determinante, 
igual que en el $ 2, con dj, nuestra igualdad toma la forma 


da;=d;, 

de donde 
dj 
g= 


puesto que d0. De este modo, queda demostrado que si el 
sistema (1) es compatible, éste posee solución única: 
d d, 


a, ute. ©) 


O 


Demostremos ahora que el sistema de números (3) satisface real- 
mente al sistema de ecuaciones (1), es decir, que el sistema (1) es com- 
patible. A continuación emplearemos las siguientes notaciones 
muy usuales, 

Toda suma de la forma ay + as +... + dp se indicará abre- 


viadamente mediante J} a;. Si se considera una suma, cuyos suman- 
a 

dos a, están provistos de dos subíndices, siendo ¿=1,2, ..., n, 

1=1,2, ..., m, se pueden tomar primero las sumas de elementos 


con el primer subíndice fijado, o sea, las sumas Y) a;;, donde i = 
E Er 5 

=4,2,..., n, y después, sumar todas estas sumas. Entonces, 

para la suma de todos los elementos a;j, obtenemos la expresión 


> 
Y ay. 
a44 


No obstante, se podrían sumar primero los sumandos a;; con el segun- 
do subíndice fijado y sumar después las sumas obtenidas. Por lo tanto, 


o sea, en la suma doble se puede cambiar el orden de los sumandos. 
Pongamos ahora en la ¿ésima ecuación del sistema (1) los valo- 
res (3) de las incógnitas. Como el primer miembro de la ¿sima 
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ecuación se puede escribir de la forma Y a,¿x, y como dj = Y) brAnrj 


obtenemos: 
D arthi D au (X dar) = 3 la (X 011413) - 


Respecto a 


stas transformaciones, observemos que el número 
4 es un factor común de todos los sumandos, por lo cual, se le ha 


sacado fuera de la suma; además, después de haber cambiado el orden 
de los sumandos, el factor ba se hi cado fuera de la suma interior, 


ya que no depende del subíndice j de la suma interior. 


Ya sabemos que la expresión Y aiyAn = andn + ardaz i 
+... | amAmes igual a d para k = i, e igual a O para los 


demás /. Por lo tanto, en nuestra suma exterior respecto a k quedará 
un sumando, precisamente bid: 


Do este modo, queda demostrado que el sistema de números (3) 
es, verdaderamente, solución del sistema de ecuaciones (1). 

Hemos obtenido el siguiente resultado importante: 

Un sistema de n ecuaciones lineales con n incógnitas, cuyo deter- 
minante es diferente de cero, tiene solución, la cual, además, es 
única. Esta solución se obtiene por las fórmulas (3), es decir, por 
la regla de Cramer; la formulación de esta regla es igual que en el caso 
de un sistema de dos ecuaciones (véase $ 2). 


Ejemplo. Resolver el sistema de ecuaciones lineales 
22 +25 8, 
2-32 —ôn= 9, 

224—323 + 274 

2, 44227234 Bra 


El determinante de este sistema es diferente de cero: 
2 1-5 4 
sala +. La, 
0 2-4 2 $ 
1 4-7 6 


$7. Regla de Cramer 


por lo que se puede aplicar al sistema la regla de Cramer. Los valores de las 


incógnitas tendrán en los mumeradores los determinantes 
8 4-5 4 285 f 
9-3 0—6 
d= =8l, da= 
e E E a e a 
0 4-7 6 
2414 804 2 1-5 8 
1—3 9—6 —3 0 9 
=-2, =21. 
2= 2 2-1-5 - 
11.40.0006 1 4-7 0 
Por lo tanto 
—4, n=, q= 


será la solución de nuestro sistema y, además, la única. 


Hemos excluido el caso en que el determinante del sistema 
de n ecuaciones lineales con n incógnitas (1) es igual a cero. Este 
caso lo dejamos para el cap. 2, donde hallará su sitio en la teoría 
general de los sistemas de cualquier número de ecuaciones con 
cualquier número de incógnita: 

Referente a los sistemas de n ecuaciones lineales con n incógni- 
tas, haremos otra observación más. Sea dado un sistema de n ecua- 
ciones lineales homogéneas con n incógnitas (véase el $ 1): 


Ayti Hata... yn = 0, 
Gyt, ota + + + + ant =0, u) 


PRAPER A 


En este caso, todos los determinates dj, j = 1, 2, ..., n, contie- 
nen una columna formada por ceros y, por eso, son iguales a cero. 
Por lo tanto, si el determinante del sistema (4) es diferente de cero, 
es decir, si a este sistema se le puede aplicar la regla de Cramer, 
su única solución será la solución nula 

x,=0, 22=0, ..., Zn=0. (5) 

De aquí se desprende la siguiente conclusión: 

Si un sistema de n ecuaciones lineales homogéneas con n incógni- 
tas tiene soluciones diferentes de la nula, entonces el determinante 
de este sistema es necesariamente igual a cero. 

En el $ 12 se mostrará que, viceversa, si el determinante de 
un sistema de éstos es igual a cero, además de la solución nula, 
cuya existencia es evidente para cualquier sistema de ecuaciones 
homogéneas, tendrán que existir también otras soluciones. 
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Ejemplo.è Para qué valores de k, el sistema de ecuaciones 
ke4 


puede tener soluciones no nulas? 
El determinante de este sistema 


ka4 
ik 
será igual a cero solamente para k = +1. Es fácil comprobar que para cada 


uno de estos dos valores de k, el sistema dado posee verdaderamente soluciones 
diferentes de la nula. 


La importancia de la regla de Cramer consiste fundamentalmente 
en que, en los casos en que es aplicable esta regla, ésta da una expre- 
sión explícita para la solución del sistema mediante los coeficientes 
del mismo. Sin embargo, la aplicación práctica de la regla de Cramer 
va aparejada con cálculos muy complicados: en el caso de un sistema 
de n ecuaciones lineales con n incógnitas, se tienen que calcular 
n -+ 1 determinantes de n-ésimo orden. El método de eliminación 
sucesiva de las incógnitas, expuesto en el $ 1, es en este sentido 
mucho más cómodo, puesto que los cálculos que se necesitan para 
aplicar este método son, en esencia, equivalentes a los que se tienen 
que realizar al calcular un solo determinante de n-ésimo 
orden, 

En algunas aplicaciones aparecen sistemas de ecuaciones lineales 
cuyos coeficientes y términos independientes son números reales, 
obtenidos al hacer mediciones de algunas cantidades físicas, es decir, 
que se conocen sólo aproximadamente, con cierta exactitud, Á veces, 
los métodos expuestos anteriormente para la resolución de tales 
sistemas son inadecuados, debido a que proporcionan resultados 
poco exactos. En su lugar, se han elaborado diversos métodos 
de iteración, o sea, métodos que permiten resolver los sistemas indi- 
cados de ecuaciones mediante una aproximación sucesiva de las 
incógnitas. La exposición de estos métodos puede consultarla 
el lector en las obras sobre la teoría de las aproximaciones. 


CAPITULO Il 


SISTEMAS DE ECUACIONES 
LINEALES (TEORIA GENERAL) 


$ 8. Espacio vectorial de n dimensiones 


Para la elaboración de la teoría general de los sistemas de ecua- 
ciones lineales no es suficiente el aparato construido que nos sirvió 
satisfactoriamente para la resolución de los sistemas en que se puede 
aplicar la regla de Cramer. Además de los determinantes y las ma- 
trices tenemos que utilizar un nuevo concepto que, posiblemente, 
sea de mayor interés para la matemática en general: el concepto 
de espacio vectorial de varias dimensiones. 

Hagamos primero unas cuantas observaciones previas. Por 
el curso de geometría analítica se sabe que todo punto en el plano 
so determina (dados los ejes coordenados) por sus dos coordenadas, 
o sea, por un sistema ordenado de dos números reales; todo vector 
en el plano se determina por sus dos componentes, o sea, nuevamente, 
por un sistema ordenado de dos números reales, De modo análogo, 
todo punto en el espacio de tres dimensiones se determina por sus 
tres coordenadas, y todo vector en el espacio se determina por sus 
bres componentes. 

En la geometría, y también en la mecánica y en la física, se sue- 
len estudiar frecuentemente algunos objetos, para cuya determina- 
ción no son suficientes tres números reales. Veamos, por ejemplo, 
el conjunto de las esferas en el espacio. Para que la esfera esté dete 
minada por completo, es necesario que estén dadas las coordenadas 
de su centro y el radio, o sea, hay que señalar un sistema ordenado 
de cuatro números reales, de los cuales el último (el radio) sólo 
puede tomar, a su vez, valores positivos. Examinemos, por otra 
parte, las diferentes posiciones de un cuerpo sólido en el espacio. 
La posición del cuerpo quedará determinada por completo, si se indi- 
can las coordenadas de su centro de gravedad (o sea, tres números 
reales), la dirección de un eje fijo que pase por el centro de gravedad 
(dos números: dos, de los tres cosenos directores) y, por fin, el ángulo 
de rotación alrededor de este eje. Por lo tanto, la posición de un sól 
do en el espacio se determina por un sistema ordenado de seis núme- 
ros reales. 
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Estos ejemplos nos sugieren la oportunidad de estudiar el con- 
junto de todos los sistemas ordenados posibles de n números reales. 
Precisamente este conjunto, después de haber introducido en él las 
operaciones de adición y multiplicación (cosa que se hará a con- 
tinuación por analogía con las operaciones correspondientes sobre 
los vectores del espacio tridimensional, expresadas mediante las 
componentes), se denomina espacio vectorial de n dimensiones, 
Por consiguiente, el espacio de n dimensiones es solamente una 
formación algebraica que conserva ciertas propiedades elementales 
del conjunto de los vectores del espacio de tres dimensiones, que 
parten del origen de coordenadas. 

Un sistema ordenado de n números 


a= (41, az, ---, an) (1) 


se llama vector de n dimensiones, Los números a;, i = 1, 2, ..., n, 
so denominarán componentes del vector æ. Se dirá que los vecto- 
res æ y 


B= (bis Da, +... bn) (2) 


son iguales, si coinciden sus componentes situadas en lugares igua- 
les, o sea, si a; = b; para ¿=4,2,..., n, Para designar los 
vectores se emplearán en adelante las letras griegas minúsculas, 
mientras que las letras latinas minúsculas se utilizarán para designar 
los números. 

Como ejemplos de vectores, señalemos los siguientes: 1) Los 
vectores-segmentos que parten del origen de coordenadas, en el plano 
o en el espacio de tres dimensiones, estando fijado el sistema de coor- 
denadas, serán vectores de dos y tres dimensiones, respectivamente, 
en el sentido de la definición dada anteriormente. 2) Los coeficientes 
de cualquier ecuación lineal con xz incógnitas forman un vector 
de n dimensiones. 3) Toda solución de cualquier sistema de ecuacio- 
nes lineales con n incógnitas es un vector de n dimensiones, 4) Dada 
una matriz de s filas y n columnas, sus filas son vectores de n dimen- 
siones y sus columnas, vectores de s dimensiones. 5) La misma ma- 
triz de s filas y n columnas se puede considerar como un vector 
de sn dimensiones: es suficiente leer seguidamente los elementos 
de la matriz, fila por fila; en particular, toda matriz cuadrada de orden 
n se puede considerar como un vector de n? dimensiones. Es evi- 
dente, además, que cualquier vector de n? dimensiones se puede 
obtener de este modo de una matriz cuadrada de orden n. 

Se llama suma de los vectores (1) y (2) al vector 


a+P=(01+b1, d+ bz, -+s an+ dm), (3) 


cuyas componentes son iguales a las sumas de las componentes 
correspondientes de los vectores que se suman. La adición de vectores 
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está sujeta a las leyes conmutativa y asociativa, puesto que la adi- 
ción de los números está sujeta a estas leyes. 
El vector nulo desempeña el papel de cero 


0=(0, 0, ..., 0). 


En efecto 
a+ 0=(81+0,42-+0, -.., An-+0)=(41, az, -p an) = 0. 


Para designar el vector nulo emplearemos el mismo símbolo O que 
se emplea para el número cero; nunca encontraremos dificultad 
alguna para averiguar si en el momento dado se trata del número 
cero o del vector nulo; sin embargo, al estudiar los próximos párra- 
fos, el lector tiene que recordar que el símbolo O se puede emplear 
en diversos sentidos. 

El vector 


—0 =(—4y, —4z, ..., — än). (5) 


se denominará vector opuesto del vector (1). Es evidente, que 
a = (a) = 0. Ahora, es fácil demostrar que para la adición 
de vectores existe la operación inversa: la sustracción; la diferencia 
de los vectores (1) y (2) es el vector a —B -a + (—B), o sea, 


a—pB= (a — b, az— br 0: Gn — bn). (6) 


La suma de vectores de n dimensiones, definida por la fórmu- 
la (3), fue originada por la suma geométrica de vectores en el plano 
o en el espacio de tres dimensiones, efectuada de acuerdo a la regla 
del paralelogramo. En la geometría se define también el producto 
de un vector por un número real (por un «escalar»): multiplicar 
el vector æ por el número k significa, siendo Æ > 0, que el vector 
a se alarga k veces (o que se contrae, si k< 1), y siendo k< O, 
que se alarga |% | veces y se cambia su dirección por la opuesta. Expre- 
sando esta regla mediante las componentes del vector y pasando 
al caso general considerado, obtenemos la definición siguiento: 

Se llama producto del vector (1) por el número k, al vector 


(kas, kaz ---, kan), (7) 
cuyas componentes son iguales al producto de las correspondientes 
componentes del vector æ por el número 


De esta definición se deducen las siguientes importantes pro- 
piedades, cuyas demostraciones se dejan al lector: 


k(a HB) = ka + kp; (8) 
(k+ )a=ka + la; (9) 
k (la) = (kl) a; (10) 
tasa. (11) 


ka =ak 
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Con la misma facilidad se comprueban, aunque pueden obtenerse 
también como consecuencia de las propiedades (8) — (11), las 
propiedades siguientes: 


(12) 
(13) 
(14) 
si ka= 0, entonces k=-0, o bien 20. (15) 


El conjunto de todos los vectores de n dimensiones con compo- 
nentes reales, considerado junto con las operaciones de suma de vec: 
tores y de multiplicación de un vector por un número, determinadas 
en el mismo, se llama espacio vectorial de n dimensiones. 

Subrayemos que en la definición de espacio vectorial de n dimen- 
siones no está incluida ninguna multiplicación de un vector por 
otro vector, Sería il definir el producto de vectores: se podría 
suponer, por ejemplo, que las componentes del producto de vectores 
fuesen iguales a los productos de las componentes correspondientes 
de los factores. Sin embargo, una tal multiplicación no tendría 
aplicaciones serias. Así, pues, los segmentos-vectores que parten 
del origen de coordenadas, en el plano o en el espacio de tres dimen- 
siones, (se supone que se ha fijado un sistema de coordenadas), forman 
un espacio vectorial de dos y de tres dimensiones, respectivamente. 
Como se ha señalado anteriormente, en este ejemplo, la suma de vec 
tores y el producto de un vector por un número tienen un sentido 
geométrico importante, mientras que al producto de vectores definido 
mediante la multiplicación de sus componentes no se le puede dar 
ninguna significación geométrica racional. 

Veamos otro ejemplo más. El primer miembro de una ecuación 
lineal con n incógnitas, es decir, la expresión de la forma 


f= 0t + artt F antn, 


se llama forma lineal en las incógnitas z,, Za, - . ., Zn. Es evidente 
que la forma lineal f queda completamente determinada por el vec- 
tor (a, az ..., aa) de sus coeficientes; reciprocamente, todo 
vector n-dimensional determina unívocamente una forma lineal. 
La suma de vectores y el producto de un vector por un número 
se convierten en las operaciones correspondientes con las formas 
lineales; estas operaciones fueron empleadas eficazmente por nosotros 
en el § 1. La multiplicación de los vectores definida mediante 
el producto de sus componentes, no tiene tampoco en este ejemplo 
ningún sentido. 
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Se dice que el vector B, de un espacio vectorial de n dimensiones, 
es proporcional al vector æ, si existe un número k tal que $ = ka 
(véase la fórmula (7) del párrafo anterior). En particular, el vector 
nulo es proporcional a cualquier vector æ, debido a la igualdad 
= 0-0. Si B = ka y B 0, de donde k + 0, entonces a = kB; 
es decir, para los vectores no nulos, la proporcionalidad posee la 
propiedad de simetría. 
Una generalización del concepto de proporcionalidad de vectores 
es la noción siguiente (con la que ya nos encontramos en el $ 4, 
para el caso de las filas de las matrices): se dice que el vector $ es una 
combinación lineal de los vectores œs, tz, . . ., as, Si existen unos 
números ly, le, ..., l, tales que 


e. +l. 


B= lias + laag + 


Por lo tanto, la j-ésima componente del vector B, j = 1, 2, |., n, 
en virtud de la definición de la suma de vectores y del producto 
de un vector por un número, es igual a la suma de los productos 
de las j-ésimas componentes de los vectores &y, @s, . . ., %, por 
los números l, la, ..., l, correspondientemente. 

Se dice que el sistema de vectores 


> Qr- Ae (r>2) (1) 


es linealmente dependiente, si al menos uno de estos vectores puede 
expresarse como combinación lineal de los demás vectores del sis- 
tema (1); en caso contrario, se dice que el sistema (1) es Zinealmente 
independiente. 

Señalemos otra forma de esta importantísima definición: el sis- 
lema de vectores (1) es linealmente dependiente, si existen unos 
números kı, ko, . . ., kp, entre los cuales al menos uno es diferente 
de cero, de modo que se verifica la igualdad 


kt + higo + krt =0. (2) 


La demostración de la equivalencia de estas dos definiciones 
no representa dificultad alguna. Sea, por ejemplo, el vector æ, del 
sistema (1), combinación lineal de los demás vectores: 


Qis Oz, 


Q, = lyt + le; a + lrir- 
De aquí se deduce la igualdad 
hast latat ~. + Ip — ar 0, 


es decir, una igualdad de la forma (2), donde k; = l; para i= 
=1, 2... r— 1 yk, = — 1, es decir, k, + 0. Reciprocamente, 
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supongamos que los vectores (1) están ligados por la relación (2), 
en le que, por ejemplo, 4, e 0. Entonces, 
a ky Ka — Ér- 

a (2) a+ (45) t-t (Jaro 
es decir, resulta que el vector a, es combinación lineal de los vecto- 
S ain ta AAN 

Ejemplo, El sistema de vectores 

y, a=(—1, 3, 3) a3={9, 7, 5), a44=(3, 8, 7) 


es linealmente dependiente, puesto que los vectores están ligados por læ 
relación 


u= 


40—02—307 1 2a, =0. 


En esta relación todos los coeficientes son diferentes de cero. Por otra parte, 
entre nuestros vectores existen también otras dependencias lineales, en las que 
algunos de los coeficientes son iguales a cero, por ejemplo 


2a; ag—ag=0, 3az+ ay 


La segunda de las definiciones de dependencia lineal dada 
anteriormente, se puede aplicar cuando r= 1, o sea, al caso 
de un sistema compuesto de un solo vector a: este sistema será lineal- 
mente dependiente cuando, y sólo cuando, a = O, En efecto, sia = 0, 
entonces, por ejemplo, para k = 1, se tiene ka = 0. Recíprocamente, 
si ka= 0 y k0, entonces, a = 0. 

Señalemos la siguiente propiedad del concepto de dependencia 
lineal. 

Si un subsistema del sistema de vectores (1) es linealmente depen- 
diente, lo es también todo el sistema (1). 

En efecto, supongamos que los vectores %, %a, ..., %, del 
sistema (1), donde s< r, están ligados por la relación 


kias + kits +... + keta =0, 


en la que no todos los coeficientes son iguales a cero. De aquí 
se deduce la relación 


kiat lega mi e. E head 0-91 t- 000% 


es decir, el sistema (1) es linealmente dependiente. 

De esta propiedad se deduce la dependencia lineal de cualquier 
sistema de vectores que contenga dos vectores iguales o, en general, 
dos vectores proporcionales, así como de cualquier sistema que con- 
tenga al vector nulo. Obsérvese que la propiedad que acabamos 
de demostrar se puede formular de otra manera: si el sistema de 
vectores (1) es linealmente independiente, cualquier subsistema 
del mismo es también linealmente independiente. 


0, 
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Aquí surgen las preguntas: ¿puede contener muchos vectores 
un sistema linealmente independiente de vectores de z dimensiones? 
y en particular, ¿existen tales sistemas con un número arbitraria- 
mente grande de vectores? Para responder a estas preguntas, con- 
sideremos en el espacio vectorial de n dimensiones los vectores 


e=(1,0,0,..., 0), 
e=(0, 4, 0,..., 0), 


(3) 


denominados vectores unitarios de este espacio. 
El sistema de vectores unitarios es linealmente independiente, Sea 


kiti + hata «+ kata =O; 
a igualdad es igual al vector 


como el primer miembro de es 
(kis kos.. -s Kn), se tiene 

(ki k: ka) =0, 
osea, ki = 0, i= 4, 2, ..., n, puesto que todas las componentes 
del vector nulo son iguales a cero y la igualdad de vectores es equi- 
valente a la igualdad de sus componentes correspondientes. 

Por lo tanto, en el espacio vectorial de z dimensiones hemos 
hallado un sistema linealmente independiente, compuesto de n vecto- 
res. El lector verá más adelante que en realidad, en este espacio 
existen infinitos sistemas de éstos. Demostremos, por otra parte, 
el siguiente teorema: 

Cualesquiera s vectores del espacio vectorial de n dimensiones 
forman, para s> n, un sistema linealmente dependiente, 

En efecto, supongamos que se han dado los vectores 


r (lin Am aaay a)y 
a= la 


> Az 


Tenemos que elegir unos números Ay, ka, +.., ka, no todos iguales 
a cero, de modo que 


has koast pa =0. 0) 


Pasando de la igualdad (4) a las igualdades correspondientes 


entre las componentes, obtenemos 
duki db azka + Hank, 0, 


Haske 


aiaks + azoka -4 
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Las igualdades (5) forman, sin embargo, un sistema de z ecuaciones 
lineales homogéneas respecto a s incógnitas kų, ka, . - -, kę. El núme- 
ro de ecuaciones en este sistema es menor que el número de incógni- 
tas y, por consiguiente, como se ha demostrado al final del $ 4, este 
sistema tiene soluciones no nulas. Por lo tanto, se pueden elegir 
unos números kj, ka, . . ., As, no todos iguales a cero, que satisfaga 
la condición (4). El teorema queda demostrado. 

Un sistema linealmente independiente de vectores de n dimen- 
siones 


Qis Azanus Ar (6) 
se llamará sistema linealmente independiente, maximal, si al agre- 
garle cualquier vector B de n d resulta un sistema lincal- 
mente dependiente. Como en cualquier dependencia lineal que liga 
los vectores Qj, a, -.., Cp B, el coeficiente de B tiene que ser 
diferente de cero (puesto que, en caso contrario, el ema (6) sería 
linealmente dependiente), el vector B se expresará linealmente 
mediante Jos vectores (6), Por ello, el sistema de vectores (6) es un si 
tema Jinealmente independiente maximal, cuando, y sólo cuando, 
los vectores (6) son linealmente independientes, y cualquier vector B 
de n dimensiones se expresa como combinación lineal de ellos. 

De los resultados que hemos obtenido anteriormente se deduce 
que en el espacio de n dimensiones, todo sistema, linealmente inde- 
pendiente, compuesto de n vectores, siempre es maximal, y también, 
que cualquier sistema de vectores linealmente independiente maximal 
no consta de más de n vecto, 

Todo sistema de vectores de n dimensiones, linealmente indepen- 
diente, está contenido, al menos, en un sistema linealmente inde- 
pendiente maximal. En efecto, si el sistema dado de vectores 
no es maximal, se le puede agregar un vector de tal modo que 
el sistema obtenido se mantenga li nte independiente, Si este 
sistema nuevo no es todavía maximal, se le puede agregar otro vector 
más, etc. Naturalmente, este proceso no se puede continuar inde- 
finidamente, puesto que cualquier sistema de vectores de z dimensiones, 
compuesto de n -+ 1 vectores, es ya linealmente dependiente. 

Como cualquier sistema que consta de un sólo vector no nulo 
es linealmente independiente, resulta que cualquier vector no 
nulo está contenido en un sistema linealmente independiente maxi- 
mal. Por consiguiente, en el espacio vectorial de n dimensiones existe 
una infinidad de diversos sístemas de vectores linealmente indepen- 
dientes maximales. 

Surge la pregunta: ¿existen en este espacio sistemas linealmente 
independientes maximales que contengan menos de n vectores, 
o el número de vectores en cualquier sistema de éstos tiene que ser, 
indispensablemente, igual a n? La respuesta a esta importante pre- 
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gunta se dará un poco más adelante, después de hacer algunas obser- 
vaciones. 

Se dice frecuentemente, que el vector B se expresa linealmente 
mediante el sistema de vectores 

E -Ma cay M (7) 

si B es una combinación lineal de ellos. Se comprende que, si el vec- 
tor B se expresa linealmente mediante un subsistema de este sistema, 
entonces se expresa lambién linealmente mediante el sistema (7). 
Para demostrar esto, es suficiente tomar los otros vectores con los 
coeficientes iguales a cero. Generalizando esta terminología, se dice 
que el sistema de vectores 


Ba Pa... Bo (8) 


se expresa linealmente mediante el sistema (7), si cada vector Bj. i 
= 1, 2, ..., ses combinación lineal de los vectores del sistema (7). 

Demostremos «que para este concepto se cumple la ley tran- 
sitiva: sí el sistema (8) se expresa linealmente mediante el siste- 
ma (7), y el sistema de vectores 

Vio Var +++ Ve (9) 

se expresa linealmente mediante el sistema (8), entonces el sistema 
(9) también se expresa linealmente mediante el sistema (7). 

En efecto 


A É (10) 


v=Y hb 
a 


pero Bi= D kimam 


expresiones, obtenemos: 


=1, 2,..., 5. Sustituyendo en (10) estas 


y Ý tal È kman) = $ ($ Lu) o 
Ea m ner 
o sea, cualquier vector yj, j = 1 
de los vectores del sistema (7) 
Dos sistemas de vectores se llaman equivalentes, si cada uno 
de ellos se expresa linealmente mediante el otro. De la ley transitiva 
que acabamos de demostrar, a la que satisface la propiedad de los 
sistemas de vectores de expresarse linealmente entre sí, se deduce 
el cumplimiento de la misma ley para el concepto de equivalencia 
de los sistemas de vectores. De aquí también se deduce la afirma- 
ción siguiente: siendo equivalentes dos sistemas de vectores, si un vector 
se expresa linealmente mediante uno de estos sistemas, entonces se 
expresa también linealmente mediante el otro. 
No se puede afirmar que siendo linealmente independiente uno 
de dos sistemas de vectores, equivalentes entre sí, lo es también 
5252 


++.» t es combinación lineal 
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el otro. Si ambos sistemas son linealmente independientes, se puede 
enunciar una proposición importante sobre el número de vectores 
que forman parte de ellos. Pero, demostremos primero el siguiente 
teorema, que debido al papel que va a desempeñar en adelante, 
lo denominaremos teorema fundamental. 

Si en el espacio vectorial de n dimensiones se han dado dos sis- 
temas de vectores 
(1 Qr Aar -ry Ors 
(11) Bi Bor > Bo 
el primero de los cuales es linealmente independiente y se expresa 
linealmente mediante el segundo, entonces el número de vectores del 
primer sistema no es superior al número de vectores del segundo sis- 
tema, es decir, r< s. 

En efecto, supongamos que r > s. Por la hipótesis, cada vector 
del sistema (1) se expresa linealmente mediante el sistema (II): 


EN aaa 
EN PEE r P. P an 
e mbr a... 7 rafa 


ales forman un sistema 


de r vectores de s dimensiones: 
ME (ln Az ds 
Ve=(021, Gz +++ Cas), 


Yr= (Ari, a 
Como rœs, estos vectores son line 
kiyi kayat ~.. i kryr 0, 


donde no todos los coeficientes ks, ke ..., kp son iguales a cer 
De aquí, llegamos a las siguientes igualdades entre las componentes: 


Š hay, 


6 
Consideremos ahora la siguiente combinación lineal de los vectores 
del sistema (I 


y Are). 
Imente dependientes, o sea, 


n OT (12) 


a H krr 


kias + kata 


o, abreviadamente, Y) kia. Aplicando (14) y (12), resulta: 
í 


= $, t (3 ab) = X, ($, ta) bs 
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lo que, sin embargo, contradice a la independencia lineal del sis- 
tema (1). 

Del teorema fundamental que acabamos de demostrar se deduce 
el resultado siguiente: 

Dos sistemas equivalentes de vectores cualesquiera, linealmente 
independientes, contiene el mismo número de vectores, 

Es evidente que dos sistemas maximales cualesquiera de vectores 
de n dimensiones linealmente independientes, son equivalentes. 
Por consiguiente, se componen de un mismo número de vectores, 
y como existen sistemas de este género compuestos de n vectores, 
obtenemos por fin la respuesta a la pregunta que se hizo anterior- 
mente: todo sistema de vectores linealmente independiente maximal 
del espacio vectorial de n dimensiones consta de n vectore 

De los resultados obtenidos se pueden deducir tambi 
consecuencias. 

Si en un sistema dado de vectores, linealmente dependiente, 
se han tomado dos subsistemas linealmente independientes maxi- 
males, o sea, dos subsistemas a los cuales no se les puede agregar otro 
vector del sistema sin violar la independencia lineal, entonces estos 
subsistemas contienen un número igual de vectores, 

En efecto, si en el siste 


E AA (13) 


1 otras 


el subsistema 
y, 0 


sari EE (1 


es linealmente independiente maxima s cualquiera de los 
vectores Osti, s Lp SE expresari Imente mediante el sis- 
tema (14). Por otra parte, cualquier vector a, del sistema (14) 
se expresa linealmente mediante este sistema: es suficiente tomar 
el mismo vector a; con el coeficiente 1, y todos los demás vectores 
del sistema con el coeficiente 0. Ahora se ve fácilmente que los 
sistemas (13) y (14) son equivalentes. De aquí se deduce que el sis- 
tema (13) es equivalente a cualquiera de sus subsistemas linealmente 
independiente maximales, por col ente, todos estos subsistemas 
son equivalentes entre sí y, siendo linealmente independientes, 
contienen un mismo número de vectores. 

El número de vectores de cualquier subsistema linealmente 
independiente maximal de dado de vectores, se lama 
rango de este sistema. Empleando esta noción, deduzcamos otra 
consecuencia más del teorema fundamental. 

Sean dados dos sistemas de vectores de n dimensiones 


On An aeos Ap (15) 


Bu Bas... Pa (16) 
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no necesariamente linealmente independientes, y sea k, el rango del 
sistema (15) y 1, el rango del sistema (16). Si el primer sistema se expre- 
sa linealmente mediante el segundo, entonces k < 1. St estos sistemas 
son equivalentes, k = L 

En efecto, sean 


Gir Miei y an 
y 

Bio Bis >> Bi, (18) 
subsistemas arbitrarios linealmente independientes maximales de los 


sistemas (15) y (16), respectivamente, Entonces, los sistemas (15) 
y (17) son equivalentes entre sí; esto mismo se refiero a los siste- 
mas (16) y (18). Como el sistema (15) s 's nealmente mediante 
el sistema (16), resulta al ema (17) también se expresa 
linealmente mediante el ma (16) y, por consiguiente, mediante 
el sistema (18), equivalente a él, después de lo cual no queda más 
que aplicar el teorema fundamental, empleando la independencia 
lineal del sistema (17). La segunda afirmación de la consecuencia 
que demostramos se deduce inmediatamente de la primera. 


$ 10. Rango de una matriz 


Dado un sistema de vectores de n dimensiones, surge la pregunta 
natural. ¿Ns linealmente dependiente este sistema o no lo es? No 
se puede esperar que en cada caso concreto se obtenga sin dificultad 
la solución de este problema. Con un examen superficial sería difícil 
observar alguna dependencia lineal del sistema de vectores 


a=(2, —5, 1, —1), B=41, 3, 6, 5), y=(—1, 4, 1, 2), 


a pesar de que, en realidad, estos vectores están ligados por 
la relación 
Ta—38+11y=0. 


El $ 1 proporciona un método para la resolución de este pro- 
blema; como son conocidas las componentes de los vectores consi- 
derados, llamando incógnitas a los coeficientes de la dependencia 
lineal buscada, obtenemos un sistema de ecuaciones lineales homo- 
góneas, que se resuelve por el método de Gauss. En el presente pá 
rrafo se indicará otro método para abordar el problema considerado; 
a la vez, nos aproximaremos considerablemente a nuestro objetivo 
principal, que consiste en resolver sistemas arbitrarios de ecuaciones 
lineales. 


$ 10. Rango de una matriz 69 


Sea dada la matriz 


Gss Aya + lin 


az a22 -.- Uan 


üs sp +++ Omn 


con s filas y n columnas, donde los números s y z no están ligados 
de ningún modo. Las columnas de esta matriz, consideradas como 
vectores de s dimensiones, pueden ser, en general, linealmente 
dependientes. El rango del sistema de columnas, o sea, el número 
máximo de columnas linealmente independientes de la matriz A 
(con mayor precisión: el número de columnas que abarca cualquier 
subsistema linealmente independiente maximal del sistema de colum- 
nas), se llama rango de esta matriz. 

Se sobreentiende, que se podrían considerar de modo semejante 
las filas de Ja ma A como vectores de n dimensiones. Resulta 
que el rango del sistema de filas de la matriz es igual al rango del 
sistema de sus columnas, es decir, es igual al rango de esta matriz. 
La demostración de esta inesperada afirmación se obtendrá después 
de que indiquemos otra forma más de definir el rango de la matriz, 
lo que proporcionará a la vez un método para su cálculo. 

Generalicemos primero el concepto de menor al caso de matrices 
rectangulares. Elijamos arbitrariamente en la matriz A, k filas 
y k columnas, k < min (s, n). Los elementos situados en las inter- 
secciones de estas filas y columnas forman una matriz cuadrada 
de k-ésimo orden, cuyo determinante se llama menor de k-ésimo 
orden de la matriz A. A continuación, nos van a interesar los órdenes 
de los menores de la matriz A, que son diferentes de cero, y, pre- 
cisamente, el mayor de estos órdenes. Para hallarlo es conveniente 
tener en cuenta la siguiente observación: si todos los menores de 
k-ésimo orden de la matriz A son iguales a cero, entonces también 
sor iguales a cero todos los menores de orden superior. Ex efecto, 
desarrollando cualquier menor de orden k K<k+tiS 
< min (s, n), por los menores de cualesq representamos 
este menor, según al teorema de Laplace, en forma de una suma 
de menores de orden k, multiplicados por ciertos menores de orden j. 
con lo que se demuestra que el menor de orden k ~ j es igual a cero. 

Demostremos ahora el siguiente teorema sobre el rango de una 
matriz: 

El orden superior de los menores, diferentes de cero, de una ma- 
triz A, es igual al rango de esta matriz. 

Demostración. Sea r el orden superior de los menores de la ma- 
triz A, diferentes de cero. Supongamos —lo que no restringe la gene- 
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ralidad de la 
situado en el 


demostrac 
ngula 


que el menor D, de r-ésimo orden, 
r de la izquierda de la matriz A 


Fini cal aaa 


LA E T 
A wa H $ R 
Varas Mig r frih rr efrin 
CETEL Mg, rire tlan 


es diferente de cero, D 20. Entonci as primeras 7 columnas 
de la matriz A serán linealmente independientes entre sí, Si hubiese 
alguna dependencia lineal entre éstas, entonces, como al sumar los 
vectores se suman Sus Compo itre las columnas del menor 
D existiria lineal y, por consiguiente, el 
menor D sería igual 

Demostremos ahora alquier Lósima columna de la ma- 
wiz A, r<i<n lineal de las primeras r columnas, 
Tomemos cualquier i 1<i¡<s, y formemos el determinante 
auxiliar de (1 — A)-ósimo orde 


a misma dependencia 
cero. 


ay- Mir 
Argo Ar 


Mt 


que so obtiene «orlando» el menor D con los elementos correspon- 
dientes de la ésima columna y de la ¿-ésima fila. Para cualquier i, 
el determinante A; es ii cero. En efecto, si ¿>> r, entonces 
A; será un menor de (r de nuestra matriz A, y, por 
lo tanto, es igual a cero, en virtud do la elección del número r. Si i< r, 
entonces A; no será ya un menor de la matriz A, puesto que no puede 
ser obtenido de esta matriz suprimiendo algunas de sus filas y cotum- 
nas; sin embargo, el determinante A; contendrá ahora dos filas igua- 
les y, por consiguiente, será de nuevo igual a cero, 
Consideremos los complementos algebraicos de los elementos 
de la última fila del determinante A;. Es evidente que el menor 
D sirve de complemento algobraico para el elemento ay. Si t-<} < 
< r, el complemento algebraico del elemento a,, en A; será el número 


«Arrr 
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éste no depende de ¿ y por eso se ha designado con A. Por lo tanto, 
desarrollando el determinante A; por los elementos de su última 
fila e igualando a cero este desarrollo, puesto que A, = 0, obte- 
nemos: 

241,4, + auD=0, 


de donde, en virtud de que D#0, 


andi + andat 


A Az Ar 
an= — p nT u. r 


Esta igualdad se verifica para todos los i, i «a, 5 y como 


sus coeficientes no dependen de iż, resulta que toda la /-ósima colum- 
na de la matriz A es una suma de sus primeras r columnas, tomadas 
A 


respectivamente con los coeficientes — 


pt poeem: i 
Por lo tanto, en el sistema de las columnas de la matriz 
hallado un subsistema linealmente independiente maximal com- 
puesto de r columnas. Con esto queda demostrado que el rango 
de la matriz A es igual a r, es decir, queda demostrado el teorema 
sobre el rango. 
e teorema proporciona un método para el cálculo práctico 
del rango de la matriz, y también para la solución del problema 
sobre la existencia de dependencia lineal en un sistema dado de vec- 
formando una matriz para la que los vectores dados sirvan 
de columnas, y calculando el rango de esta matriz, obtenemos 
el número mayor de vectores de nuestro sistema, linealmente inde- 
pendientes. 

El método a el culo del rango de una matriz, basado 
en el teorema sobre el rango, requiere el cálculo de un número 
de menores de esta matriz que, aunque es finito, puede ser muy 
grande. Sin embargo, la siguiente observación da la posibilidad 
de introducir en este método simplificaciones considerables. Si el lec- 


tor examina otra vez más la demostración del teorema sobre el rango 
de la matriz, observará que al efectuarla no se aplicó la igualdad 
a cero de todos los menores de (r + 1)-ésimo orden de la matriz 4, 


sino que se usaron solamente los menores de (r 1)-ósimo orden 
que orlaban al menor dado D de r-ésimo orden, diferente de cero 
(o sea, que lo contienen totalmente dentro de sí). Por lo tanto, 
de la igualdad a cero solamente de estos menores, se deduce que r 
es el máximo número de columnas linealmente independientes 
de la matriz A. Esto último trae consigo la igualdad a cero de todos 
los menores de (r -- 4)-ésimo orden de esta matriz. Llegamos a la 
siguiente regla para el cálculo del rango de una matriz: 

Al calcular el rango de una matriz se debe pasar de los menores 
de menor orden a los de orden mayor. Habiendo hallado un menor 
D de k-ésimo orden diferente de cero, se deben calcular solamente 
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los menores de (k -- 1)-ésimo orden que orlan al menor D: si todos 
éstos son iguales a cero, el rango de esta matriz es igual a k. 
Ejemplos. 
L. Hallar el rango de la matriz 


4-1 105) 


El menor de segundo orden, situado en el ángulo superior de la izquierda 
de esta matriz, es igual a cero. Sin embargo, en esta matriz hay también 
monoros de segundo orden, diferentes de cero, por ejemplo, 


243 
a | 233 [#0 
EI menor de torcer orden 
2 4 3 
e=ji=2 1j. 
0 1 1 


es un orlado del menor d, diferente de cero, d'= 1, no obstante, los orla- 
dos de cuarto orden del menor d’ son iguales a cero: 


2-4 3 1 2-4 30 
1 —2 1-4 1-2 12 
a Ft 3l=% lo 4-24 +0 
4-7 4-4 láa-7 45 


A es igual a tres. 


Por lo tanto, el rango de la ma 
cali udependiente, maximal en el 


2. Hallar un subsistema, 1 
sistema de vectores 


a =(2, —2, —4), az= (1, 9, 3), a= 
Formamos la matriz 
21-2 3 
(= 9—4 7). 
—43 1-1 


en la que los vectores dados sirven de columnas. El rango de esta:matriz es 
igual a dos: el menor de segundo orden situado en el ánguo superior de la 
quierda es diferente de cero, pero los dos menores orlados de él, de tercer order 
son iguales a coro, De aquí se deduce que los vectores a, az forman en el siste- 
ma dado uno de los subsistemas linealmente independientes maximales. 


4, 1), a= (3, 7, — 1). 


Como consecuencia del teorema sobre el rango de una matriz 
demostremos la afirmación ya enunciada anteriormente: 

El máximo número de filas linealmente independientes de cual- 
quier matriz es igual al máximo número de sus columnas linealmente 
independientes, es decir, es igual al rango de la matriz. 
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Para la demostración, trasponemos la matriz, o sea, sus 
filas las hacemos columnas, conservando su numeración. En la 
transposición, el máximo orden de los menores de la matriz dife- 
rentes de cero no puede alterarse, puesto que la trasponsición no 
altera al determinante y para cualquier menor de la matriz inicial, 
el menor obtenido de él por transposición está contenido en la nueva 
matriz y viceversa. De aquí se deduce que el rango de la nueva 
matriz es igual al rango de la matriz inicial; éste a su vez es igual 
al máximo número de columnas linealmente independientes de la 
nueva matriz, es decir, igual al máximo número de filas linealmente 
independientes de la matriz inicial. 


jemplo. En el $8 se introdujo el concepto de la forma lineal en n incógnitas 
y se dio la definición de suma de formas lineales y de su producto por un número. 
Bobiidafinición: permite omeralizar/el bonospto/do dependencia linsa], con CAIRN 
sue gropiedados, Daraa tai de loreaas asile 

Sea dado el sistema de formas 


h= 2z =r: — 33 


Se necesita y en él un subsistema linealmente independiente maximal. 
Formemos la matriz de los coeficientes de estas formas: 


y hallemos su rango. El menor de segundo orden, situado en el ángulo superior 
de la izquierda, es diferente de cero. Pero, como fácilmente se comprueba, sus 
cuatro determinantes orlados de tercer orden son iguales a coro. De aquí se 
deduce que las primeras dos filas de nuestra matriz son linealmente independien- 


tes, tras que la tercera y la cuarta son combinaciones lineales de ellas. 
Por consiguiente, el sistema fs, f2 es el subsistema buscado del sistema dado do 
formas lineales. 


ante del teorema sobre 


Señalemos otra consecuencia impor 
el rango de una matriz. 

Un determinante de n-ésimo orden es igual a cero cuando, y sólo 
cuando, entre sus filas existe una dependencia lincal. 

En una dirección, es ó demostrada en el $ 4 
(propiedad 8). Supongamos ahora que se ha dado un determinante 
mo orden igual a cero o, en otras palabras, una matriz cua- 
drada de n-ósimo orden, cuyo único menor de máximo orden es igual 
a cero. De aquí se deduce que el máximo orden de los menores 
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de la matriz que son diferentes de cero es menor que z, o sea, que el 
rango es menor que n, y, por lo demostrado anteriormente, las fifas de 
esta matriz son linealmente dependientes. 

Se sobreentiende que en el enunciado de la consecuencia que 
hemos demostrado se puede hablar de las columnas del determinante, 
en lugar de las filas. 


Existe también otro método para calcular el rango de una matriz que no 
está ligado con el teorema sobre el rango y que no requiere el cálculo de determi- 
nantes. Pero se puede aplicar solamente cuando so quiera determinar el mismo 
Tango y ho interese saber qué columnas (o filas) son las que precisamente forman 
un sistema linealmente independiente maximal. Veamos este método. 

Se llaman transformaciones elementales de una matriz A a las $ 

(a) la permutación (trasposición) de dos filas o de dos columnas; 

(b) la multiplicación de una fila (o de una columna) por un número arbi- 
trario diferente de cero; 

(e) la suma a una fila (o a una columna) de otra fila (columna) multipli- 
cada por un número, 

Fácilmente se observa que las transformaciones elementales no alteran el 
rango de la matriz. En efecto, si, por ejemplo, se aplican estas transformacio- 
nes a las columnas de la matriz, entonces el sistema de columnas, consideradas 
como vectores, se sustituye por otro equivalente, Demostremos esto solamente 
para la transformación (c), puesto que para las (a) y (b), es evidente. Supongamos 
que a la ¡-ésima columna se agı ésima columna, multiplicada por el núme- 
ro k. Si antes de la transformación, 


guientes: 


basan E TS o 


sorvían de columnas de la matriz, después de la transformación servirán de 
columnas los vectores 


p sees =P XQ], <<, Aj 0001 Ano e 


El sistema (2) se expresa linealmente mediante el sistema (1). La igualdad 
a= a; —kaj 


muestra a su vez, que el sistema (1) se expresa linealmente mediante el (2). Por 
consiguiente, estos sistemas son equivalentes, y sus subsistemas, linealmente 
independientes maximales están compuestos de un mismo número de vectores. 

Por lo tanto, para calcular el rango de una matriz, se puede simplificar 
previamente mediante una combinación de transformaciones elementales. 

Se dice que una matriz que consta de s filas y n columnas es de forma diago- 
nal, si todos sus elementos son iguales a cero, a excepción de los elementos an, 
asa, ==> arp (donde O < r < min (s, n)), que son iguales a la unidad. Es evidente 
que el rango de esta matriz es igual a 7. 

Toda matriz se puede reducir a la forma diagonal mediante transformaciones 
elementales. 

En efecto, sea dada la matri 
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Si todos sus elementos son iguales a cero, esta tiene la forma diagonal. Si on olla 
hay elementos diferentes de cero, trasponiendo filas y columnas se puede con- 
seguir que el elemento au sea diferente de coro, Multiplicando después la prime- 
ra fila por az}, convertimos el elemento an en la unidad, Restando ahora de la 
j:ésima columna, j > f, la primera columna, multiplicada por a, se sustituye 
por cero el elemento ay. Electuando esta transformación con todas las colum- 
has, comenzando con la segunda, y también con todas las filas, llegaremos a la 
matriz de la forma: 


10 o 
CO 


O aja «>s ain 


Luego efectuamos estas mismas transformaciones con la matriz que queda en el 
ngulo inferior de la derecha, etc., ete., Después de reiterar este proceso una 
cantidad finita de veces, llegaremos a la matriz diagonal que tiene ol mismo 
rango que la matriz inicial A. 
Por lo tanto, para hallar el rango de una matriz hay que reducir esta matriz 
mediante transformaciones elementales a la forma diagonal y calcular el número 
de unidades que hay en su diagonal principal. 


Ejemplo. Hallar el rango de la matriz 


o 24 
14 5 

1 3a 7 
o 5—10 

2:82 p 


Transponiendo en esta matriz la primera y segunda columna, y mult 
4 i A 1 ds 
plicando la primera fila por el número <-, llegamos a la matriz 


1.3 7]. 
5 0-10 
E A Y 


Agregando a su tercera col 


primera dupli 
una de 1 


demás filas un múltiplo de la nueva primera fila, obtenemos la matriz 


EE 
0—1 3 
o 3 9] 
o o o 


oaz 6 
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Finalmente, multiplicando la segunda fila por —1, restando de la tercera colum- 


na la segunda, multiplicada por tres, y restando de la tercera y quinta filas 
unos múltiplos de la segunda fila nueva, llegaremos a la forma diagonal buscada 
1 0.0 
oao 
o o of. 
0.0.0 
o oo 


Por lo tanto, el rango de la matriz A es i 

En el cap. 13 nos encontraremos otra vez con las 
tales y con la forma diagonal de la matriz; pero será 
no serán números sino polinomios. 


usformaciones elemen- 
atrices cuyos elementos 
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Estudiaremos ahora sistemas arbitrarios de ecuaciones lineales, 
sin suponer que el número de ecuaciones sea igual al número de incóg- 
nitas, Nuestros resultados se podrán aplicar también al caso (que 
quedó sin examinar en el $ 7) en el que el número de ecuaciones sea 
igual al número de incógnitas, siendo el determinante igual a cero. 

Sea dado un sistema de ecuaciones lineales 


antn = by, 


aee + Aonta == lg, új 


aTi + astat -o © H- A snEn = by. 
Como sabemos por el $ 4, ante todo se debe resolver el problema 
sobre la compatibilidad de este sistema. Con este fin, tomemos 
la matriz A de los coeficientes del sistema y la matriz «amplia- 
da» A, obtenida al agregar a la matriz A la columna de los términos 
independientes, 
ass Aya ss Gin as a + Agn by 


ánodo E dx da «0 On 
aaf A E A 


A A E ies Bin e 
y calculemos los rangos de estas matrices. Es fácil ver que el rango 
de la matriz A, o es igual al rango de la matriz A, o es mayor en 
una unidad. En efecto, tomemos un sistema máximal de columnas 
de la matriz A, linealmente independiente. Este también será lineal- 
mente independiente en la matriz A. Si conserva también la pro- 
piedad de ser maximal, o sea, que la columna de los términos inde- 


11. Sistemas de ecuaciones lineales a 


pendientes se expresa linealmente mediante el mismo, entonces los 
rangos de las matrices A y A son iguales; en caso contrario, agregando 
a este sistema la columna de los términos independientes, obtenemos 
el sistema linealmente independiente de columnas de la matriz A, 
que en ésta será maximal. 

El problema de la compatibilidad de un sistema de ecuaciones 
lineales se resuelve difinitivamente con el siguiente teorema, 

Teorema de Kronecker-Capelli. El sistema de ecuaciones (1) 
es compatible cuando, y sólo cuando, el rango de la matriz amplia- 
da Á es igual al rango de la matriz A. 

Demostración. 1. Supongamos que el sistema (1) es compatible 

y que kr Kar... Kn una de sus soluciones. Sustituyendo estos 
números en lugar de las incógnitas del sistema (1), obtenemos s iden- 
tidades, que muestran que la última columna de la matriz A es una 
suma de todas las demás s con los coeficientes 
Ko, aa ns respectivamente. Cualquiera otra columna de la ma- 
triz A forma parte también de la matriz A y, por eso, se expresa 
linealmente mediante todas las columnas de esta matriz. Reciproca- 
mente, toda columna de la matriz A es también columna de la ma- 
triz A, o sea, se expresa linealmente mediante las columnas de esta 
matriz. De aquí se deduce que los sistemas de columnas de las matri- 
ces A y A son equivalentes entre sí. Por consiguiente, como se demos- 
tró al final del $ 9, estos dos sistemas de vectores de s dimensiones 
tienen un mismo rango; en otras palabras, los rangos de las matri- 
cos A y A son iguales entre sí. 

2. Supongamos ahora que las matrices A y A tienen un mismo 
rango. De esto se deduce, que cualquier sistema linealmente inde- 
pendiente maximal de columnas de la matriz A se mantiene también 
en la matriz A como sistema linealmente independiente maximal, 
Por lo tanto, la última columna de la matri > expresa lineal- 
mente mediante este sistema y, por con: mediante el sis- 
tema de columnas de la n A. stema de coe- 
ficientes ky, ka, .... kn tal que la suma de las columnas de la ma- 
triz A, tomadas con estos coeficientes, es igual a la columna de los 
términos independientes. De aquí que los números kp ka... fn 
formen una solución del sistema (1). Por ello, la coincidencia de los 
rangos de las matrices A y A trae consigo la compatibilidad del 
sistema (1). 

El teorema queda demostrado. 

Al aplicar este teorema en los ejercicios prácticos, es necesario 
calcular primero el rango de la matriz A. Para esto hay que hallar 
uno de los menores de la matriz que sea diferente de cero y cuyos 
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orlados sean iguales a cero; sea éste el menor M. Después se deben 
calcular todos los menores de la matriz A que son orlados de M, pero 
gue no estén contenidos en A (los llamados determinantes caracte- 
rísticos del sistema (1)). Si todos éstos son iguales a cero, el rango 
de la matriz A es igual al rango de la matriz A y, por consiguiente, 
el sistema (1) es compatible; en caso contrario, es incompatibl 
De aquí que el teorema de Kronecker-Capelli se pueda enunciar 
del modo siguiente: el sistema de ecuaciones lineales (1) es compa- 
tible cuando, y sólo cuando, todos sus determinantes característicos 
son iguales a cero, 

Supongamos ahora que el sistema (1) es compatible. El teorem 
de Kronecker—Capelli, mediante el que establecemos la com 
tibilidad de este sistema, afirma la existencia de una solució 
mas éste no proporciona ningún método para la averiguación práctica 
de todas las soluciones del sistema. Pasemos ahora a resolver este 
problema. 

Supongamos que la matriz A es de rango r, Como se ha demos- 
trado en el párrafo anterior, r es el máximo número de filas lineal- 
mente independientes de la matriz A. Para precisar, supongamos 
que las primeras r filas de la matriz A son linealmente independien- 
tes, y que cada una de las demás es combinación lineal de ellas. 
Entonces, las primeras r filas de la matriz A serán también lineal- 
mente independientes: toda dependencia lineal entre ellas sería 
también una dependencia lineal entre las primeras r filas de la ma- 
triz A (ivéase la definición de la suma de vectores!). De la coinci- 
dencia de los rangos de las matrices A y A se deduce que las pri- 
meras r filas de la matriz A forman en ésta un sistema maximal de 
filas linealmente independiente, o sea, que cualquier otra fila 
de esta matriz es combinación lineal de ellas. 

De aquí se deduce que cualquier ecuación del sistema (1), se pue- 
de representar como una suma de las primeras 7 ecuaciones, tomadas 
con ciertos coeficientes. En consecuencia, cualquier solución simul- 
tánea de las primeras r ecuaciones satisface también a todas las 
ecuaciones del sistema (1). Por consiguiente, es suficiente hallar 
todas las soluciones del sistema 


ATi + Aga + E an 


Ay Ty -F A2233 + 


2 


ant, + artat -© F arma 


Como las filas formadas por los coeficientes de las incógnitas 
en las ecuaciones (2) son linealmente independientes, o sea, la ma- 
triz de Jos coeficientes es de ranga r, se tiene que r< n. Además, 
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al menos uno de los menores de r-ésimo orden de esta matriz es dife- 
rente de cero. Si r = n, entonces (2) será un sistema con igual número 
de ecuaciones que de incógnitas y con un determinante diferente 
de cero, por lo que éste y Lambién el sistema (1), tendrán solución 
nica, que es precisamente la que se calcula por la regla de Cramer. 

Supongamos ahora que r < n, y para precisar, supongamos que 
es diferente de cero el menor de r-ésimo orden, formado por los 
coeficientes de las primeras r incógnitas. Traslademos al segundo 
miembro, en cada una de las ecuaciones (2), todos los términos que 
contienen las incógnitas 2,41 , +. +, £, y elijamos para estas incóg- 
nitas algunos valores Cra, .-., Cp. Obtenemos un sistema 
de r ecuaciones 


AT + arnt: e E lirt, = by — Ay, 194 — + + + — Qin 


Arty H Aggtg + n. H Art p = bg — ap, ri4Criy — +++ — Aon En, B 


Apt F arata- -oo A pr = br — ar, rg — + + © — Anën 


con respecto a r incógnitas, 21, £a, . + ., Zr A este sistema se le pue- 
de aplicar la regla de Cramer, poseyendo por lo tanto, una solución 
única, c, ae € es evidente que el sistema de números 
Cis Cas oa ay Cry Crits e> ee Cu representa una solución del siste 
ma (2). Como los valores cr, .. «> Cn, para las incógnitas dps ..- 
++. Zn, Mamadas incógnitas independientes, podían ser clegidos 
arbitrariamente, se pueden obtener de este modo infinitas soluciones 
distintas del sistema (2). 

Por otra parte, toda 


n del sistema (2) se puede obtener 
por el método indi obtenido alguna solución ci, Ca... 
+. ., €, del sistema (2), como valores para las incógnitas i 
dientes tomamos los nÚMETOS Cry, + Entonces 
TOS C4, Ca, + > «+ C, Serán solución del sist y, por con: 
formarán la única solución de este sistema, que se calcula por 
la regla de Cramer. 

Todo lo expuesto anteriormente se resume en la siguiente regla 
para la solución de un sistema arbitrario de ecuaciones lineales: 

Sea dado un sistema compatible de ecuaciones lineales (1) y sea 
r el rango de la matriz A de los coeficientes del sistema. Elijamos 
en A, r filas linealmente independientes y dejemos en el sistema (1) 
solamente aquellas ecuaciones, cuyos coeficientes forman parte de las 
filas elegidas. Dejemos en los primeros miembros de estas ecuaciones 
r incógnitas, de modo que el determinante formado por los coeficien- 
tes de ellas sea diferente de cero, mientras que las otras incógnitas 
lasconsideramos independientes, trastadándolas a los segundos miembros 
de las ecuaciones. Dando valores numéricos arbitrarios a las incógnitas 
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independientes y calculando los valores de las demás incógnitas por 
la regla de Cramer, obtenemos todas las soluciones del sistema (1). 
He aquí de nuevo el enunciado del resultado obtenido: 
Un sistema compatible (1) tiene solución única cuando, y sólo 
cuando, el rango de la matriz A es igual al número de las incógnitas. 
Ejemplos. 1. Resolver el sistema 
5ry— 294229 27, 
Rrit rap ár9— 21, 
11—319—6734+57=0. 
El rango de Ja matriz de los coeficientes es igual a dos: el menor de segundo 
orden, situado en el ángulo superior de la izquierda de esta matriz, es diferente 


de cero, pero ambos menores vrlados de tercer orden son iguales a cero. 
El rango de la matriz ampliada es igual a tres, puesto que 


5-47 
e tt 
1-30 


De aquí se deduce que el sistema es incompatible, 
2. Resolver el sistema 


áz + 9x9 

EL rango de la matriz de los coeficie 
número de incógnitas; el rango de la matriz ampliada tambié 
Por lo tanto, el sistema es compatible y tiene solu i 
miembros de las primeras dos ecuaciones son 
viendo el sistema de estas dos ecuaciones, obte 
las incógnitas: 


sea, es igual al 
es igual a dos. 
ca. Los primeros 
almente independientes; resol- 
emos los siguientes valores para 


AS E 


Vemos fácilmente que esta solución satisface también a la tercera ecuación. 
3, Resolver el sistema 


E ne 


23 n+ n=l, 
32y=4, 
aq 5x9 97384 4 750. 

El sistema es compatible, puesto que el rango de la matriz ampliada al igual 

jue el de la matriz de los coeficientes igual a dos. Los primeros miembros 
le la primera y tercera ecuaciones son linealmente independientes, puesto 
que los coeficientes de las incógnitas z, y z, forman un menor de segundo 
orden diferente de cero. El sistema de estas di uaciones lo resolvemos supo- 
niendo que las incógnitas z3, z4, z5 Son independientes; para ello, trasladamos 
éstas a los segundos miembros de las ecuaciones y suponemos que ya se les han 
atribuido valores numéricos. Aplicando la regla de Cramer, obtenemos; 


Br — Tap 73 4x4 
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Estas igualdades determinan la solución general del sistema dado: asignan- 
do a las incógnitas independientes valores numéricos arbitrarios, obtenemos 
todas las soluciones de nuestro sistema. Así pues, son soluciones de nuestro siste- 
ma, por ejemplo, los vectores (2, 5, 3, 0,0), (3, 5, 2, 1, —2),(0, — 4, 1, $), 
ete, Por otra parte, sustituyendo las expresiones para z, y z; de la solución 
general en cualquiera de las ecuaciones del sistema, por ejemplo, en la segunda, 
que fue anteriormente excluida, obtenemos una identidad. 

4. Resolver el sistema 


A pesar de que el número de ecuaciones es igual al número de incógnitas, 
mo so puede aplicar la regla de Cramer, pues ol determinanto del sistema os 
igual a coro. El rango de la matriz de los coeficientes es igual a tres: en el ángulo 
superior de la derecha de esta matriz está situado un menor de tercer orden, 
diferente de cero, El rango de la matriz ampliada también es igual a tres, es 
decir, el sistema es compatible. Examinando solamente las primeras tres ecua- 
cionos y tomando la incógnita z, como independiente, obtenemos la solución 
general en la forma: 


2 
ap g= 


5. Sea dado un sistema compuesto de n +4 ecuaciones respecto a n incóg- 
nitas, La matriz ampliada A de este sistema es cuadrada, do orden n -+ 1. 
Sifnuestro sistema es compatible, entonces, según el teorema do Kronecker- 
Capelli, el determinante de la matriz Ẹ tiene que ser igual a cero. 

Asi, pues, sea dado el sistema 


nsn- 3, 
zga a) 


Tag= —de 


El determinante de los coeficientes y de los términos indop»ndientes de estas 
ecuaciones es diferento de coro: 


1-3 3 
| 1 4 [<—77 


por lo tanto, ol sistema es incompatible. 

En goneral, la afirmación recíproca no es justa: de la igualdad a cero del 
determinante de la matriz A no so deduce la coincidencia de los rangos de las 
matrices A y 


0252 
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$ 12. Sistemas de ecuaciones líneales homogéneas 


Apliquemos los resultados del párrafo anterior al caso de un sis- 
tema de ecuaciones lineales homogéneas: 


0) 


Gasty t latei 


Del teorema de Kronecker-Capelli se deduce que este sistema 
siempre es compatible, puesto que, agregando una columna de ceros, 
no se puede elevar el rango de la matriz. Por cierto, esto se observa 
inmediatamente, ya que el sistema (1) siempre posee la solución 
nula (0, 0, ..., 0). 

Supongamos que la matriz A de los coeficientes del sistema (1) 
es de rango r. Si r=n, la solución nula es la única solución del sis- 
tema (4); si r< n, el sistema posee también soluciones diferentes 
de la nula; para hallar todas estas soluciones se emplea el mismo 
método que anteriormente se usó en el caso de un sistema arbitrario 
de ecuaciones. En particular, un sistema de n ecuaciones lineales 
homogéneas con n incógnitas tiene soluciones diferentes de la nula 
cuando, y sólo cuando, el determinante de este sistema es igual a cero*. 
En efecto, la igualdad a cero de este determinante es equivalente 
a Ja afirmación de que el rango de la matriz ÆA es menor que n. Por 
otra parto, si en el sistema de ecuaciones lineales homogéneas el núme- 
ro de ecuaciones es menor que el número de incógnitas, el sistema 
posee indispensablemente soluciones diferentes de la nula, puesto 
que en este caso el rango no puede ser igual al número de las incóg- 
nitas; este resultado fue obtenido en el $ 1 por medio de otros 
razonamientos. 

Veamos en particular el caso de un sistema, compuesto de n — 1 ecuaciones 


homogéneas con respecto a n incógnitas, en el que se supone que los primeros 
miembros de las ecuaciones son lincalmente independientes entre sí. Sea 


en an ~ am 


la matriz de los coeficientes de este sistema; designemos con M; el menor de 
{n — 4)-ósimo orden, obtenido después de suprimir en la matriz A la iésima 


columna, i= 4, 2, >=, n. Entonces, una de las soluciones de nuestro sistema se- 
rá el sistema de números 
My ~My My Más +0 (1 Mn, a 


* Una mitad de esta afirmación se demostró ya en el $ 7. 


$ 12. Sistemas de ecuaciones lineales homogéneas ES 


y cualquier otra solución será proporcional a ésta. 

Demostración. Como, por hipótesis, el rango de la matriz A es igual 
an — 1, uno de los menores Mç tiene que ser diferente de cero; supongamos 
que sea Mp. Tomemos la incógnita z, como independiente y la traslademos al 
segundo miembro en cada una de las ecuaciones, obteniendo: 


anz + aare 

auti + amr 

anmi, 121+ an1, 272 
Aplicando ahora la regla de Cramer, obtenemos la solución general del sistema 
dado de ecuaciones, la cual, después de sencillas transformaciones, puede ser 
expresada de la forma siguiente: 


3 My 
-0m7 


My n-13n-1= — 0121 


0, m1Zn- 1 —üpntn, 


cd tn — O, nn. 


== 


Fns - (3) 
Haciendo zp =(—1)"-1 Mp, obtenemos Ai- Mi, id cl, 
o bien, como la diferencia (2n — ¿— 1) — (i — 1) = 2n — 2i es un número 
par, z; = (—4)-1 My, es decir, ol sistema de números (2) es verdaderamente 
una solución de nuestro sistema de ecuaciones. Cualquier otra solución do este 
sistema so obtiene de las fórmulas (3) con otro valor númerico de la incógnita 
xn, por lo que será proporcional a la solución (2). Se comprendo que la afirma- 
ción considerada es justa también cuando M, = O, siendo diferente de cero 
uno de los menores Mi, 1< i< n — 1. 

Las soluciones de un sistema de ecuaciones lineales homogéneas 
poseen las siguientes propiedades. Si el vector P = (by, da 
<.. Da) es una solución del sistema (1), entonces, para cualquier 
número k, el vector kP = (kbj, kba, ... , kba) también será sobu- 
ción de este sistema. Esto se comprueba inmediatamente por sus- 
titución en cualquiera de las ecuaciones (1). Si, además, el vector 
Y= (Cis Cas... Cp) es otra solución del sistema (1), el vector 
B y= (bi den baten a, Dn + Cp) también será solución 
de este sistema: 


Y ay (byte) = X aybj+ Y ayjej=0, 
A A F- 


Por eso, en general, cualquier combinación lineal de soluciones del 
sistema homogéneo (1) será también solución de este sistema. Obsér- 
vese que en el caso de un sistema no homogéneo, o sea, de un sistema 
de ecuaciones lineales, cuyos términos independientes no son todos 
uales a cero, la afirmación correspondiente no se cumple: ni la 
suma de dos soluciones de un sistema de ecuaciones no homogéneas, 
ni el producto de una solución de este sistema por un número, será 
ya solución de este sistema. 

Por el $ 9 se sabe que cualquier sistema de vectores de n dimen- 
siones, compuesto de más de n vectores, es linealmente dependiente. 
De aquí se deduce que entre las soluciones del sistema homogé- 
neo (1) (como es sabido, éstas son vectores de n dimensiones) se pue- 


e 
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de elegir un sistema finito linealmente independiente maximal 
de modo que sea maximal en el sentido de que cualquier otra solu- 
ción del sistema (1) sea combinación lineal de las soluciones que 
forman parte de este sistema elegido. Todo sistema maximal de solu- 
ciones linealmente independientes del sistema de ecuaciones homo- 
góneas (1), se llama sistema fundamental de soluciones. 

Subrayemos otra vez más que un vector de n dimensiones es solu- 
ción del sistema (1) si, y sólo si, éste es combinación lineal de los 
vectores que forman el sistema fundamental dado. 

Se entiende que existirá un sistema fundamental solamente 
en el caso en que el sistema (1) tenga soluciones no nulas, o sea, 
cuando el raugo de su matriz de los coeficientes sea menor que 
el número de las incógnitas. En tal caso, el sistema (1) puede tener 
muchos sistemas de soluciones fundamentales diversas, Sin embargo, 
todos estos sistemas serán equivalentes entre sí, puesto que cada 
vector de cada uno de estos sistemas se expresa linealmente mediante 
cualquier otro sistema, Por ello, los sistemas constan de un mismo 
número de soluciones. 

Subsiste el siguiente teorema: 

Si el rango r de la matriz de los coeficientes de un sistema de ecua- 
ciones lincales homogéneas (1) es menor que el número de las incóg- 
nitas n, entonces cualquier sistema fundamental de soluciones del 
sistema (1) consta de n — r soluciones. 

Para la demostración, observemos que n— r es el número 
de incógnitas independientes en el sistema (1); supongamos que 
las incógnitas independientes son: Zp, Zmz,» «y Zn. Considere- 
mos un determinante cualquiera d, de orden n — r diferente de cero, 
que lo escribiremos de la forma siguiente: 


Carreta Cay rez + + Cin 
Cnn Carin o Cmn 
Oper, rei n-or, rtze 0001 Caoran 


Tomando los elementos de la i-ésima fila de este determinante, 
1<i<»n—r, como valores para las incógnitas independientes, 
obtenemos como es sabido, unos valores univocamente determinados 
para las incógnitas zı, Ze, - - -, Zp, O sea, llegaremos a una solu- 
ción completamente determinada del sistema de ecuaciones (1 
escribamos esta solución en forma de vector 


ai= (Cis Cia + 


El sistema obtenido de vectores %;, Œa, -. -, n-r representa 
un sistema fundamental de soluciones del sistema de ecuaciones (1). 
En efecto, este sistema de vectores es linealmente independiente, 


Cir Ci, rèis Cl, pez ++ Cin) 
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puesto que la matriz formada por estos vectores como filas contiene 
un menor d, de orden n — r, diferente de cero. Por otra parte, sea 


P= (bn ber +1 brs brins Drszs -.-» bn) 
una solución arbitraria del sistema de ecuaciones (1). Demostremos 
que el vector f$ se expresa linealmente mediante lós vectores 
Qis Ar, >u y Anor: 

Designemos con aj, i = 1, 2, ..., n— r, la i-ésima fila del 
determinante d, considerada como un vector de (z — r) dimensiones 
y sea 

B' = (brin brin o., bn). 
Los vectores œi, i= 1, 2, ..., n—r son linealmente independientes, 
ya que d+0. Sin embargo, el sistema de vectores de (n — r) dimen- 
siones 


A A 


es linealmente dependiente, debido a que en éste el número de vecto- 
res es mayor que las dimensiones de ellos. Por consiguiente, existen 
unos números ky, ka, . . s kn. tales que 


P= kiai e kin-ranr (4) 
Examinemos ahora el vector de n dimensiones 
= kya, + kia... + nr tr — Bo 


El vector 8, siendo combinación lineal de las soluciones del sistema 
de ecuaciones homogéneas (1), representa también una solución 
del mismo, De la igualdad (4) se deduce que en la solución 8 los 
valores para todas las incógnitas independientes son iguales a cero. 
No obstante, la única solución del sistema de ecuaciones (1) que 
resulta con los valores iguales a cero para las incógnitas indepen- 
dientes, es la solución nula. Por lo tanto, ô — 0, de donde 


b 


El teorema queda demostrado. 

Obsérvese que la demostración expuesta nos permite afirmar 
que tomando por d todos los determinantes posibles de orden n—r, 
diferentes de cero, obtenemos todos los sistemas fundamentales 
de soluciones del sistema de ecuaciones homogéneas (1). 


ES E A 


Ejemplo. Sea dado el sistema de ecuaciones lineales homogéneas * 
Bad za Bryt ai 150, ) 
2 — 239 3x3 Tre} 2e5= 
liz) — 12r Mir 
z— 5r, 217—16x, 315 
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rango de la matriz de los coeficientes es igual a dos; el número de 
incógnitas es igual a cinco. Por consiguiente, cualquier sistema fundamental 
de soluciones de esto sistema de ecuaciones consta de tres soluciones. Resolva- 
mos el sistema limitándonos a las dos primeras ecuaciones linealmente indepen- 
dientes y tomando como independientes las incógnitas zs, z4, 75. Obtenemos 
la solución general de la forma: 


Tomemos luego los siguientes tres vectores de tres dimensiones, linealmente 
independientes: (1, 0, 0). (0, 1. 0), (0, O, 1). Sustituyendo las componentes de 
cada uno de ellos en la solución general, en calidad de valores para las incógni- 
tas indopendientes, y, calculando los valores para zı y z2, obtenemos el siguien- 
to sistoma fundamontal de sofuciones del sistema dado de ecuaciones: 


Por último, consideremos la relación que existe entre las solu- 
ciones de los sistemas homogéneos y no homogéneos. Sea dado 
un sistema de ecuaciones lincales no homogéneas: 


antt Atado v Dr, 
Gasti de Arata -H Ann = Da, 5 
6) 
aTa H Garta -i «$ an Tn = Da 
El sistema de ecuaciones lineales homogéneas 
anti-H aata -+ Cinta =0, 
AuTi Aga t -E aont, 
(6) 


obtenido del sistema (5) al sustituir por ceros los términos inde- 
pendientes, se llama sistema reducido. Entre las soluciones de los 
sistemas (5) y (6) existe una notable relación, como lo muestran 
perfectamente los dos teoremas siguientes: 

I. La suma de cualquier solución del sistema (5) con cualquier 
solución del sistema reducido (6) será nuevamente solución del sis- 
tema (5). 

En electo, sea Cy, Ca, .--» Cn una solución del sistema (5) 
Y di, de, . - ., da, una solución del sistema (6). Tomemos cualquiera 
de las ecuaciones del sistema (5), por ejemplo la k-ósima, y susti- 
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tuyamos en ella, en lugar de las incógnitas, los números c; + dą, 


Ca > dz, ...s En T da. Resulta: 
Y alerta) Y anyes Y) anjdy = ba + O = br 
£ j É 


II. La diferencia de dos soluciones cualesquiera del sistema 
es solución del sistema reducido (6). 

En efecto, sean Ci, Ce, «+. Cn Y Ci Cp ..., Ch dos soluciones 
del sistema (5). Tomemos cualquiera de las ecuaciones del siste- 
ma (6), por ejemplo la k-ésima, y sustituyamos en ella, en lugar 
de las incógnitas, los números 


s Cn— Ch 


ir EC 
Resulta: 


Y anjej— Y) arjej = Un — Un 
A 4 

De estos teoremas se deduce que, hallando una solución del sis- 
tema de ecuaciones lineales no homogéneas (5) y sumándola con cada 
una de las soluciones del sistema reducido (6), obtenemos todas las 
soluciones del sistema (5) 


CAPITULO 1I 
ALGEBRA DE LAS MATRICES 


$ 13, Multiplicación de matvices 


En los capítulos anteriores el concepto de matriz se había empleado 
como un instrumento auxiliar, esencial para el estudio de los 
temas de ecuaciones lineales. Las numerosas y diversas aplicaciones 
de este concepto contribuyeron a convertirlo en el objetivo de una 
amplia teoría particular gue, en gran parte, sale fuera de los már- 
genes de nuestro curso. Ahora nos ocuparemos de los fundamentos 
de esta teoría que comienza definiendo de un modo original, pero 
bien fundamentado, dos operaciones algebraicas: la suma y la mul- 
tiplicación, aplicables al conjunto de todas las matrices cuadradas 
de un orden dado. Examinemos primero la definición del producto 
de matrices; la suma de matrices la veremos en el $ 15. 

Por el curso de geometría analítica se sabe que al girar los ejes 
de un sistema rectangular de coordenadas en el plano, en un ángu- 
lo ez, las coordenadas de los puntos se transforman según las fór- 
mulas siguientes: 


=z cosa—y sena, 
y 


=z sen a + yl cos a, 


donde z, y son las coordenadas primitivas del punto, mientras que 
a’, y' son sus coordenadas nuevas; por lo tanto, x € y se expresan 
linealmente mediante z’ e y’, con ciertos coeficientes numéricos, 
En diversas ocasiones también nos encontramos con la necesidad 
de efectuar una transformación de las indeterminadas (o de las 
variables) tal, que las indeterminadas primitivas queden expresadas 
linealmente mediante las nuevas; ordinariamente, esta sustitución 
de las indeterminadas se llama transformación lineal (o sustitución 
lineal). Por consiguiente, llegamos a la siguiente definición: 

Se llama transformación lineal de las indeterminadas al paso 
del sistema de n indeterminadas 24, T2, - . ., Zn al sistema de n inde- 
terminadas yı, Y2, -- <> Yn, de manera que las indeterminadas 
primitivas queden expresadas linealmente mediante lás nuevas 
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con ciertos coeficientes numéricos: 


F anyan 


e + mnym w 


AS 


La transformación lineal (1) se determina completamente por 
la matriz de los coeficientes 


An A see Ain 


an am ... azn 


lny lng ünn 


puesto que dos transformaciones lineales con una misma matriz 
pueden diferenciarse entre sí solamente en las letras que designan 
indeterminadas; sin embargo, nosotros supondremos que la elec- 
ción de estas notaciones corre a nuestro cargo. Recíprocamente, 
dada una matriz arbitraria de n-ésimo orden, podemos escribir 
inmediatamente una transformación lineal, para la que esta matriz 
sirva de matriz de sus coeficientes. Por lo tanto, entro las trans- 
formaciones lineales de n indeterminadas y las matrices cuadradas 
de n-ésimo orden existe una correspondencia biunívoca, y por ello, 
a cualquier noción ligada con las transformaciones lineales y a cual- 
quier propiedad de estas transformaciones tiene que corresponder 
una noción o una propiedad análoga, referente a las matrices. 
Examinemos la cuestión sobre la realización consecutiva de dos 
transformaciones lineales. Supongamos que después de la transfor- 
mación lineal (1), se ha realizado la transformación lineal 


(2) 


Yn= Dart i naza + 


tema de indeterminadas yu Yo >. -ı Ya POr 
el sistema Zi, Zo, --., Zn; designemos con Æ la matriz de esta 
transformación. Sustituyendo en (1) las expresiones para y, Yo, - ++ 
- «<> Un, dadas en (2), llegaremos a unas expresiones lineales para 
las 'indeterminadas 7, z», ..., Za mediante las indelerminadas 
Zi, 22 . - «> Zn. Por lo tanto, el resultado de la realización consecu- 
tiva de dos transformaciones lineales de las indeterminadas, es de nuevo 
una transformación lineal. 


que sustituye al 
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Ejemplo. El resultado de la realización consesutiva de las transforma- 
ciones lineales 


= M-—Ya 
YH va 


a 
es la transformación lineal 
Mu+z)— Azt 2a) 

(atza Ház H2) =21214 1129, 

Designemos con C la matriz de la transformación lineal que 
representa el resultado de la realización consecutiva de las trans- 
formaciones (1) y (2), y hallemos la ley por la que se expresan los 
elementos cin, i, k = 1, 2, ..., n mediante los elementos de las 


matrices A y B. Escribiendo abreviadamente las transformacio- 
nes (1) y (2) en la forma 


j ayyy 14,2, va, m w= X tnan j=1,2,...,M 


obtonomos 
Sar tn) 1 aut) a ¿=1, 2, 
z PEIA ža) PASE n)an ¿=1, 2 


En consecuencia, el coeficiente de z, en la expresión para zi, es 
decir, el elemento cin de la matriz C, tiene la forma 


cin -2 Qijbjr = anbiya + arbar + > + + + Ginbani (8) 


el elemento de la matriz C, situado en la i-ésima fila y en la k-ésima 
columna, es igual a la suma de los productos de los correspondientes 
elementos de la i-ésima fila de la matriz A y de la k-ésima columna 
de la matriz B. 

La fórmula (3), que da la expresión de los elementos de la ma- 
triz C mediante los elementos de las matrices A y B, permite escribir 
inmediatamente la matriz C, siendo dadas las matrices A y B, sin 
recurrir a las transformaciones lineales correspondientes a estas 
matrices. De este modo, a cualquier par de matrices cuadradas 
de n-ésimo orden se pone en correspondencia una tercera matriz 
unívocamente determinada. Se puede decir que hemos definido 
una operación algebraica en el conjunto de todas las matrices 
cuadradas de n-ésimo orden; ésta se llama multiplicación de las 
matrices, y la matriz C, producto de la matriz A por la matriz B: 


C=AB. 
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Enunciemos una vez más la relación entre las transformaciones 
lineales y el producto de las matrices: 

La transformación lineal de las indeterminadas obtenida como 
resultado de la realización consecutiva de dos transformaciones linea- 
les con las matrices A y B, tiene a la matriz AB por matriz de sus 
coeficientes, 


Ejemplos 


TENE erca fate 


EEN 

d () = hii eE z 

4) Hallar el resultado de la realización consecutiva de las transforma- 
ciones lineales 


a — Va +3 
3 Y—Ya 
Fgm Tyz—ys 


n 
n= 
Ya 

Multiplicando las matricos, obtenemos: 


IR 


Eg 
E as 


n= 529 —3zg. 
Tomemos uno de los ejemplos que acabamos de estudiar de multi- 
plicación de las matrices, por ejemplo el 2), y hallemos el producto 
de las mismas matrices, pero tomadas en orden inverso: 


—3 10 01 —8 3-1 
0 214]. -2 32] = 0.5 9 
0-13 4 —t 14 —=6 43 
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Vemos, pues, que el producto de las matrices depende del orden 
de los factores, es decir, que la multiplicación de las matrices 
no es conmutativa, Por cierto, esto era de esperar, aunque sólo sca 
por el hecho de que, en la definición de Ja matriz C, dada anterior- 
mente mediante la fórmula (3), las matrices A y B no figuran 
de un modo equivalente: en A se toman las filas, mientras que 
en B, las columnas. 

Se pueden señalar, para todos los», comenzando desde n = 2, 
ejemplos de matrices de n-ésimo orden no conmutables, o sea, de ma- 
trices cuyo producto se altera al permutar los factores (las matrices 
de segundo orden en el ejemplo 1) no son conmutables). Por otra 
parto, dos matrices pueden ser ocasionalmente conmutables, como 
muestra el siguiente ejemplo: 


7 —12 /2645 eS 7-12 (23 

=4 7) 1526)"l1526/ 1-4: 7/7 i 
El producto de las matrices es asociativo; par consiguiente, 
puede hablar del producto, unívocamente determinado, de cual- 
quier número finito de matrices de n-ésimo orden, tomadas (en vir- 
tud de que el producto no es conmutativo) en un orden determi- 
nado. 

Demostración. Sean dadas tres matrices arbitrarias de n-ésimo 
orden, A, B, y C, Escribámoslas del modo abreviado siguiente, 
donde se indica la forma general de sus elementos: A = (a;;), 
B = (bi), C = (cis). Introduzcamos luego las siguientes notacio- 
nes: 


BC =V = (017), 
A(BC)=T=(t1)). 


"Tenemos que demostrar que se cumple la igualdad (48)C = 
= A(BC), es decir, S=7. Sin embargo, 


un = Y ambn, 0 Y buei 
¿A A 
de donde, en virtud de las igualdades S=UC y T=AV, 
sy= X uuey= Y Y anbuciy, 
“A iai 


ty= Y an Y 
A IN 


o sea, si = t; parai,j=1,2,...,n. 
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Para el estudio ulterior de las propiedades del producto de las 
matrices se necesita el empleo de los determinantes. Además, para 
abreviar, convendremos en designar con [A | el determinante de la 
matriz A. Si en cada uno de los ejemplos considerados anterior- 
mente el lector calcula los determinantes de las matrices que se 
multiplican y compara el producto de estos determinantes con 
el determinante del producto de las matrices dadas, puede observar 
una ley bastante curiosa que se expresa con el siguiente importante 
teorema sobre el producto de los determinantes: 

El determinante del producto de varias matrices de n-ésimo orden 
es igual al producto de los determinantes de estas matrices. 
suficiente demostrar este teorema para el caso de dos matri- 
ces. Sean dadas las matrices de n-ésimo orden A = (a;;) y B = (bj) 
y sea AB = C = (ci). Formemos el siguiente determinante auxi- 
liar A de orden 2n: en su ángulo superior de la izquierda colocamos 
la matriz A, en el ángulo inferior de la derecha, la matriz 4%, todo 
el ángulo superior de la derecha lo ocupamos con ceros, Finalmente, 
formamos la diagonal principal del ángulo inferior de la izquierda 
con el número —1, ocupando todos los demás lugares también con 
ceros. Por consiguiente, el determinante A tiene la forma siguiente: 


A A. is 0 0... 0 


das. Bas e E O ol 
am Gne oee AmO O 0 

A i 

O a. O Du bess bm | 
AA NS 


5 43 A 
A y A A | 


La aplicación del teorema de Laplace al determinante — su 
«desarrollo por los menores de las primeras n filas —nos Heva a la 
siguiente igualdad: 

A 


14]-1B1. 


Procuremos, a su vez, transformar el determinante A de tal 
modo que, sin cambiar su valor, todos los elementos bj, i, j = 
1, 2, ..., n, queden sustituidos por coros, Con este fin, agre- 
guemos a la (n+ 1)-ésima columna del determinante A su primera 
columna, multiplicada por b; 
por bz, etc., y finalmente, su n- 
bni Después, agreguemos a la (n -+ 2)-ésima columna del determi- 
nante A la primera columna, multiplicada por by, la segunda colum- 
na, multiplicada por bs», etc. En general, agreguemos a la(n + j)- 


, su segunda columna, multiplicada 


sima columna, multiplicada por 
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ésima columna del determinante A, donde j = 4, 2, ..., n, la suma 
de las primeras n columnas, tomadas con los coeficientes b,;, b2j, . .. 
~., nj, respectivamente. 

Fácilmente se ve que estas transformaciones, no alterando 
el determinante, dan lugar a la sustitución de todos los elemen- 
tos bi; por ceros. A la vez, en lugar de los ceros que figuraban 
en el ángulo superior de la derecha del determinante, aparecerán 
los números siguientes: en la intersección de la ¿-ésima fila y (n + 
+ j)-ésima columna del determinante, í, j = 1, 2, ..., n, estará 
ahora el número a:1b,;-+ Aj2baj +... + ambn y, que en virtud de (3) 
es igual al elemento c;; de la matriz C = AB. Por consiguiente, 
el ángulo superior de la derecha del determinante lo ocupa ahora 
la matriz C: 


E A A 
Gay am e Gsm Cot Coa ce Con 
£ E tt: E 
lid E re E 07 0) aten D 
Y HL... UND 0 
t horti Ero A 


Apliquemos otra vez más el teorema de Laplace, desarrollando 
el determinante por los menores de las últimas n columnas. Como 
el menor complementario para el menor |C | es ígual a (—1)", 
y el menor | C | está situado en las filas cuyos números de orden 
son 1,2, ..., n y en las columnas cuyos números de orden som 


n+4, nm +2, ..., 2n, aplicando la igualdad 
1424. pn+ (041) +(0+2) +... +20=24n, 
se tiene 
A= (AE AO | = (40101 


o bien, como el número 2(1*%-+1) es par, 
A=|C1. (5) 
Finalmente, de (4) y (5) se deduce la igualdad que queríamos 
demostrar 
|1€]=14|-181. 
El teorema sobre el producto de los determinantes podría haber 


sido demostrado también sin la utilización del teorema de Laplace. 
El lector hallará una de estas demostraciones al final del $ 16. 
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Una matriz cuadrada se llama degenerada (o singular), si su deter- 
minante es igual a cero, y no degenerada (o no singular)*, en el caso 
contrario. Correspondientemente, una transformación lineal de las 
indeterminadas se llama degenerada o no degenerada, según que 
el determinante de los coeficientes de esta transformación sea igual 
a cero o no. Del teorema demostrado al final del párrafo anterior, 
se deduce la afirmación siguiente: 

El producto de matrices, al menos una de las cuales es degenera- 
da, es también una matriz degenerada. 

El producto de cualesquiera matrices no degeneradas también 
es una matriz no degenerada. De aquí se deduce, en virtud de la rela- 
ción existente entre el producto de las matrices y la realización 
consecutiva de las transformaciones lineales, la proposición siguien 
te: el resultado de la realización consecutiva de unas cuantas trans 
formaciones lineales será una transformación no degenerada cuando, 
y sólo cuando, todas las transformaciones dadas sean no degeneradas. 

En el producto de las matrices, el papel de la unidad lo desempeña 
la matriz 


10...0 

01:20 
E A 

00 1 


que es además conmutable con cualquier matriz A del orden dado, 
AE=LA=A. 0) 
Estas igualdades se demuestran aplicando directamente la regla 
de multiplicación de las matrices, o basándose en la observación 
de que la matriz unidad corresponde a la transformación lineal 
idéntica de las indetermivadas 
Ti Ya 


a Yns 
cuya realización, antes o d de cualquier otra transformación 
lineal, no cambia, evide „esta última. 

Obsérvese que la matriz E es la única que satisface a la condi- 
ón (1) para cualquier matriz A. En efecto, si existiese otra ma- 
triz E” con esta propiedad, tendríamos que 

EE-E, EEE, 


de donde, E" = E. 


+ También se llama matriz regular. (Nota del T.) 
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El problema do la existencia de la matriz inversa para una matriz 
dada A es más complicado. Como el producto de las matrices no 
es conmutativo, hablaremos ahora de la matriz inversa a la derecha, 
o sea, de una matriz A tal, que el producto de la matriz A por 
esta matriz a la derecha es igual a la matriz unidad, 


A4AI= 


e) 


Si la matriz A es degenerada y existiese la matriz A”, el producto 
que figura en el primer miembro de la igualdad (2) sería, como 
ya sabemos, una matriz degenerada. En realidad, la matriz E que 
figura on el segundo miembro de esta igualdad no es degenerada, puesto 
que su determinante es igual a la unidad, Por lo tanto, una matriz 
degenerada no puede tener matriz inversa a la derecha. Estos mismos 
razonamientos muestran que ésta nt puede tener tampoco matriz 
inversa a la izquierda, no existiendo, por lo tanto, matriz inversa 
para una matriz degenerada. 

Refiriéndonos al caso de una matriz no degenerada, introduzcamos 
primero el siguiente concepto auxiliar. Sea dada una matriz de 
n-ésimo orden 


Ay liz +. Ayn 
an an ... Gy 
O m oz 2n 
Ant ün + Can 


La matriz 


Ar 


Ain 


formada por los complementos algebraicos de los elementos de la ma- 
triz A, donde el complemento algebraico del elemento a;; está situado 
en la intersección de la j-ésima fila y de la i-ésima columna, se llama 
matriz adjunta de la matriz A. 

Hallemos los poductos AA* y A*A. Aplicando la fórmula estu- 
diada en el $ 6, sobre el desarrollo de un determinante por los 
elementos de una fila o columna, y también el teorema del $ 7, 
sobre la suma de los productos de los elementos de cualquier fila 
(o columna) de un determinante por los complementos algebraicos 
de los elementos correspondientes de otra fila (columna), y desig- 
nando con d el determinante de la matriz A, 


d=141, 
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obtenemos las siguientes igualdades: 


d 0...0 
arr=ara= po 2000], e 
0 0...d 


De aquí se deduce que, si la matriz A no es degenerada, su matriz 
adjunta A* tampoco lo será, siendo además, el determinante d* de 
la matriz A* igual a la (n—1)-ésima potencia del determinante d de 
la matriz A. 

En efecto, pasando de las igualdades (3) a la igualdad entre los 
determinantes, obtenemos: 

dd’ =à", 
de donde, como d ++ 0, 
dogs. 

Ahora es fácil demostrar la existencia de una matriz inversa 
para cualquier matriz A no degenerada, y hallar su forma. Obsérvese 
primero que si se considera el producto de dos matrices AB y se divi- 
den por un mismo número d todos los elementos de uno de los facto- 
ros, por ejemplo B, entonces, todos los elementos del producto 
AB también se dividirán por este mismo número: para la demos- 
tración solamente hay que recordar la definición del producto 
de las matrices. Por lo tanto, si 

d=|4|%0, 
de las igualdades (3) se deduce, que la inversa de la matriz A es 


la matriz que resulta de la matriz adjunta A* al dividir todos sus 
elementos por el número d: 


En efecto, de (3) se deducen las igualdad: 
Aa- ALA E. u) 
Subrayemos una vez más que en la ¿ésima fila de la matriz 4 


figuran los complementos algebraicos de los elementos de la ¿-ósima 
columna del determinante |A |, didos por d = | A |. 


* Se podría demostrar que si la matriz A es degenerada, su matriz adjun- 
la 4* también lo es, teniendo además un rango no superior al número 1. 


7262 
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Es fácil demostrar que la matriz A“ es la única que satisface 
a la condición (4) para una matriz dada A, no degenerada. En efecto, 
si la matriz Ç es tal que 


AC=CA=E, 
entonces, 
CAAI=C(AA)=CE=C, 
CAAT=(CA)AM=EAI=A47, 


de donde C =A“, 

De (4) y del teorema sobre el producto de los determinantes, 
se deduce que cl determinante de la matriz ATi es igual ar . Así, 
pues, esta matriz tampoco es degenerada; la inversa para ella es la 
misma matriz A. 

Si se dan ahora las matrices cuadradas A y B de n-ósimo orden, 
de las cuales A no es degenerada, mientras que B es arbitraria, 
podemos efectuar la división por fa derecha y por la izquierda de Æ 
por A, es decir, resolver las ecuaciones ' matriciales 


AX=B, YA=B. (5) 
Para esto, en virtud de la asociatividad del producto de las matri- 
ces, es suficiente hacer 

X=A7B, Y =BA7; 
como el producto de las matrices no es conmutativo, por lo general, 


estas soluciones de las ecuaciones (5) serán diferentes. 
Ejemplos. 1) Se da la matriz 


3-10 
a0(-: ial. 
2—14 


Su determinante [-4[=5, por consiguiente, la matriz inversa 4-2 existe: 


lad 

i 

v o 
ola alg ela 

l 


© 


2) Se dan las matrices 


a= B 
la 3)" 
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La matriz A no es degenerada, y además, 


E) 


por fo tanto, las soluciones de las ecuaciones AX=8B, YA=B serán las 
matrices 
3D (AN_(-9 48 
(ES 3) ( 35)=( 13 a): 
yet US 3-2 _/-3 2 
E ( $5 (a J-C ae 
Multiplicación de matrices rectangulares. El producto de las 
matrices definido en el párrafo anterior solamente para las matrices 
cuadradas de igual orden, puede generalizarse también para el caso 
de matrices rectangulares A y B, siempre que sea posible aplicar 
la fórmula (3) del párrafo anterior, o sea, cuando cada fila de la ma- 
triz A contenga tantos elementos como haya en cada columna de la 
matriz B. En otras palabras, se puede hablar del producto de las 
matrices rectangulares A y B cuando el número de columnas de la 
matriz A es igual al número de filas de la matriz B. En este caso, 
el número de filas de la matriz AB es igual al número de filas 


de la matriz A, y el número de columnas de la matriz AB es igual 
al número de columnas de la matriz B. 


Ejemplos. 
-13 0 
p 7i 30m [21 4 10 15 —5 
) E 0-14] 30-2 =ls 10 rA 
41 2 
0-3 4 3 8 
» 2 5)(-2)-( 5). 
4 0-2 2 —16 
2.0 
<% 
3) (5 1 0—3- S i =(14 —1). 
0-1 


El producto de las matrices rectangulares se puede ligar con 
la ejecución consecutiva de las transformaciones lineales de las 
indeterminadas solamente si en la definición de estas últimas 
no se insiste en que se conserve el número de indeterminadas en 
la transformación lineal. 

7 
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Repitiendo palabra por palabra la demostración dada anterio 
mente para el caso de las matrices cuadradas, se comprueba fácil 
mente que la ley asociativa se cumple también para el producto 
de matrices rectangulares. 

Ahora utilizaremos el producto de las matrices rectangulares 
y las propiedades de la matriz inversa para deducir de nuevo la regla 
de Cramer, evitando los complicados cálculos que se realizaron 
en el $7. Sea dado un sistema de n ecuaciones lineales con z incóg- 
nitas: 


aut, F tysta H oo H Anta = by 
ayt, Hasta d+ > H lanta = ba, 


(6) 


AmTy anata A + + + + an = bas 
donde el determinante del sistema es diferente de cero. Designemos 
con A la matriz de los coeficientes del sistema (6); esta matriz 
no es degenerada, ya que, por la suposición hecha, d = | A | + 0. 
Designemos con X la columna de las incógnitas; con B, la columna 
de los términos independientes del sistema (6), es decir, 


z, b, 
EN ba 
X=] > h »-]: 
Za bn 


El producto AX tiene sentido, puesto que el número de columnas 
de la matriz A es igual al número de filas de la matriz X, y además, 
este producto será una columna, formada por los primeros miembros 
de las ecuaciones del sistema (6). Por lo tanto, el sistema (6) puede 
escribirse en forma de una ecuación matricial 


AX=B. a) 
Multiplicando a la izquierda ambos miembros de la ecuación (7) 


por la matriz A“l, cuya existencia es consecuencia de que la matriz 
cuadrada A no es degenerada, obtenemos: 

X= A%B. (8) 

El producto que figura en el segundo miembro de esta igualdad 

es una matriz de una sola columna; su j-ésimo elemento es igual 

a la suma de los productos de los elementos de la j-ésima fila de la 

matriz A”! por los elementos correspondientes de la matriz B, es 

decir, es igual al número 
Ay 
T 


sd An 
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Sin embargo, la expresión que figura entre paréntesis en el segundo 
miembro de la igualdad es el desarrollo por los elementos de la 
jésima columna del determinante dj, que se obtiene sustituyendo 
la j-ésima columna del determinante d por la columna B. Por lo 
tanto, las fórmulas (8) son equivalentes a las fórmulas (3) del $ 7, 
que expresan la solución del sistema (6) obtenida por la regla 
de Cramer, 

Queda por demostrar que los valores obtenidos de las incógnitas 
forman verdaderamente una solución del sistema (6). Con este fin, 
es suficiente poner la expresión (8) en la ecuación matricial (7), 
lo que da lugar, evidentemente, a fa identidad B =B. 

El rango del producto de las matrices. En el caso de matrices 
degeneradas, el teorema del producto de los determinantes no 
nos lleva a ningún enunciado más de que tal producto también 
es degenerado, a pesar de que las matrices cuadradas degeneradas 
se pueden diferenciar también por su rango. Obsérvese que no 
existe una dependencia absolutamente determinada entre los ran- 
gos de los factores y el rango del producto, como se muestra en los 


ejemplos siguientes: 
la 0 G 0 la 0) 
00) loo/=loo/* 


E o) 00 le o) 

00)” 03)= 00)” 

en ambos casos se multiplican matrices de rango 1. Sin embargo, en 
un caso el producto tiene el rango 1, mientras que en el otro, el rango 
es ÔD. Subsiste solamente el siguiente teorema, que no sólo es justo para 
las matrices cuadradas, sino también para las matrices rectangulares: 

El rango del producto de varias matrices no es superior al rango 
de cada uno de los factores. 

Es suficiente demostrar este teorema para el caso de dos factores 
Sean dadas las matrices A y B, para las cuales tiene sentido el pro- 
ducto AB; emplearemos la notación AB = C. Veamos la fórmula (3) 
del $13, que da la expresión de los elementos de la matriz C. Toman- 
do esta fórmula para un k dado y todos los ¿ posibles, (¿ = 1, 2, ...) 
obtenemos que la k-ósima columna de la matriz C representa una 
suma de todas las columnas de la matriz A, tomadas con ciertos coe- 
ficientes (precisamente con los coeficientes bja, Dor, ...). De este 
modo, queda demostrado que el sistema de columnas de la matriz C 
se expresa linealmente mediante el sistema de columnas de la ma- 
triz A, y, por consiguiente, como se ha demostrado en el $ 9, el rango 
del primer sistema es menor o igual al rango del segundo sistema; 
en otras palabras, el rango de la matriz C no es mayor que el rango 
de la matriz A. Por otra parte, como de la misma fórmula (3) del 
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$ 13, para un į dado y todos los k, se deduce que toda ¿-ósima fila 
de la matriz C es combinación lineal de las filas de la matriz B, con 
razonamientos análogos obtenemos que el rango de C no es mayor 
que el rango de B. 

Cuando uno de los factores representa una matriz cuadrada no 
degenerada, se obtiene un resultado más exacto. 

El rango del producto a la derecha y a la izquierda de una ma- 
triz A por una matriz cuadrada no degenerada Q, es igual al rango 
de la matriz A. 

Sea, por ejemplo, 

AQ=C. (9) 


Del teorema precedente se deduce que el rango de la matriz C no es 
mayor que el rango de la matriz A. Por otra parte, multiplicando a la 
derecha la igualdad (9) por Q~, llegamos a la igualdad 

A=CQ% 
y, por consiguiente, otra vez por el teorema precedente, el rango de 4 
no es mayor que el rango de C. Comparando estos dos resultados 
obtenemos la coincidencia de los rangos de las matrices A y C. 


15. Suma de matrices y multiplicación 
y P 
de una matriz por un número 


Para las matrices cuadradas de orden n, la suma se define del 
modo siguiente: 

Se llama suma A +B de dos matrices cuadradas A = (a¡y) 
y B = (bı;) de orden n, a una matriz C = (c1) tal, que cualquier 
elemento de ella es igual a la suma de los elementos correspondientes 
do las matrices 4 y B; 


Cij=ayjtby* 


Es evidente, que la suma de matrices definida es conmutativa 
y asociativa. Para ella existe la operación inversa: la resta, llamán- 
dose diferencia de las matrices A y B a la matriz formada por las 
diferencias de los elementos correspondientes de las matrices dadas. 
En este caso, el papel de cero lo desempeña la matriz nula, compues- 
ta totalmente de ceros; a continuación, esta matriz se designará 
con el símbolo 0: no hay peligro de confundir la matriz nula con 
el número cero. 

La suma de las matrices cuadradas y el producto de éstas, defini- 
do en el $ 13, están ligados con las leyes distributivas. 

* Por supuesto, se podría definir también el producto de matrices multi- 


plicando los elementos correspondientes. Sin em! esta multiplicación, 
a diferencia de la que se definió en el $ 13, caracerí aplicaciones serias. 
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En efecto, sean dadas tres matrices de orden n, A = (ay), B = 
= (bis), C = (ci). Entonces, para cualesquiera ¿ y j, se cumple la 
igualdal 


a a a 
Y Cret bis) esy = Y istart Y bistaz 


El primer miembro de esta igualdad es el elemento situado en la 
i-ésima fila y j-ósima columna de la matriz (4 + B) C, el segundo 
miembro es el elemento situado en el mismo lugar, pero en la matriz 
AC + BC. Con esto, queda demostrada la igualdad 


(4+B)C=AC + BC. 


La igualdad C (A + B) = CA + CB se demuestra del mismo modo. 
Como el producto de matrices no es conmutativo, se deben demostrar 
estas dos leyes distributivas. 

Introduzcamos la siguiente definición de producto de una ma- 
triz por un número. 

Se llama producto kA de una matriz cuadrada A = (a,;) por 
el número k, a la matriz A' = (aj;) que so obtiene multiplicando 
por k todos los elementos de la matriz A: 


ai= kaij. 


En el párrafo anterior ya tratamos un ejemplo de multiplicación 
la matriz A no es degenerada, sien- 
do | A |= d, su matriz inversa Al y su matriz adjunta A* están 
ligadas por la igualdad 


l i 


Como ya sabemos, toda matriz cuadrada de orden n se puede 
considerar como un vector de n? dimensiones, siendo biunívoca esta 
correspondencia entre las matrices y los vectores. En este caso, las 
operaciones definidas de suma de matrices y de producto de una 
matriz por un número, se convierten en la suma de vectores y en el 
producto de un vector por un número. Por lo tanto, el conjunto de 
las matrices cuadradas de orden n se puede considerar como un espa- 
cio vectorial de n* dimensiones. 

De aquí se deduce el cumplimiento de las igualdades siguientes 
(aquí, A, B son matrices de orden n; k, 1 son unos números; 1 es el 
número uno): 


(A+ B)=kA+kB, a) 
(k+) A=kA+1A, (2 
k (LA) = (kI) A, (3) 


1-4=4. 4 
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Las propiedades (1) y (2) ligan el producto de una matriz por un 
número con la suma de matrices. Al mismo tiempo, existe una liga- 
zón importante entre el producto de una matriz por un número y el 
producto de las matrices mismas, que se expresa así: 


(k4) B = A (kB) = k (AB), ( 


o sea, si en el producto de las matrices, uno de los factores se multi- 
plica por el número k, todo el producto queda multiplicado por k. 

En efecto, sean dadas las matrices A = (a;;) y B = (bis) y el 
número k. Entonces, para cualesquiera i y j, se tiene: 


J 
k X tutay 


ò (kais) bs, 
ʻA 


Poro, el primer miembro de esta igualdad es el elemento situado 
en la t-ésima fila y j-ésima columna de la matriz (¥A) B, y el segundo 
miembro es el elemento situado en el mismo sitio en la matriz 
k(AB). Con esto queda demostrada la igualdad 


(kA) B= k (AB). 


La igualdad A(kB) = k (AB) se demuestra del mismo modo. 

La multiplicación de una matriz por un número permite introdu- 
cir un nuevo método de expresión de las matrices. Designemos con 
E; la matriz en la que, en la intersección de la i-ésima fila y j-ósi- 
ma columna figura la unidad, mientras que todos los demás elemen- 
tos son iguales a cero. Haciendo i = 1, 2, ..., n y j = A, 2, aa n, 
obtenemos n* matrices de éstas, E;j, que, como fácilmente se com- 
prueba, están Jigadas por la siguiente tabla de multiplicar: 


EuE,j=Eij, Enbi=0 para s+ t. 


La matriz kE, solamente se diferencia de la matriz Ei en que 
en ella figura el número k en la intersección de la ¿ésima fila 
y j-ésima columna. Teniendo esto en cuenta y aplicando la defini- 
ción de suma de matrices, obtenemos la siguiente expresión para una 
matriz cuadrada arbitraria A: 


Oy 2 + - am 


e AS SAT © 


Ans an2 > Ann 


poseyendo, evidentemente, la matriz A una sola expresión de la 
forma 
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La matriz kE, donde E es la matriz unidad, según la definición 
del producto de una matriz por un número, tiene la forma siguiente: 


k o 


k 
kE = x i 

o k 
o sea, en la diagonal principal figura un mismo número k, mientras 
que todos los elementos situados fuera de esta diagonal son iguales 

a cero. Tales matrices se llaman escalares. 
La definición de la suma de matrices conduce a la siguiente 

igualdad 

RE+IE=(k40E. (7) 


Por otra parte, aplicando la definición del producto de matrices 
o basándose en la igualdad (5), obtenemos: 


kE-1E =(kl) E. (8) 


El producto de una matriz A por un número k se puede interpretar 
como el producto obtenido al multiplicar A por la matriz escalar kE, 
en el sentido de la multiplicación de matrices. En efecto, según (5) 


(KE) A=A (KE) =k 


De aquí se deduce también, que toda matriz escalar es conmuta- 
ble con cualquier matriz A. Es de gran importancia tener en cuenta 
que las matrices escalares son las únicas que poseen esta propiedad: 

Si una matriz C=(c;)) de n-ósimo orden es commutable con 
cualquier matriz del mismo orden, la matriz C es escalar. 

En efecto, supongamos que ¿+ j y consideremos los productos 
CE, y E,,C (véase más arriba la definición de la matriz £;,) que, 
por hipótesis, son iguales entre sí. Fácilmente se observa que todas 
las columnas de la matriz CE;,, menos la j-ésima, se componen de 
ceros, y que la j-ésima columna coincide con la iésima columna 
de la matriz C; en particular, en la intersección de la ¡-ésima fila 
y j-ésima columna de la matriz CE, está situado el elemento ci. 
Análogamente, todas las filas de la matriz £,,C, menos la ¡-ósima, 
se componen de ceros, y la i-ésima fila coincide con la j-ésima fila 
de la matriz C; en la intersección de la i-ésima fila y j-ósima colum- 
na de la matriz E,,C está situado el elemento c,;. Aplicando la 
igualdad CE, = E¡,C, obtenemos que: ci; = cy, (como elementos 
situados en lugares iguales de matrices que son iguales entre sí); 
o sea, todos los elementos de la diagonal principal de la matriz C 
son iguales entre sí. Por otra parte, en la intersección de la j-ésima 
fila y j-ésima columna de la matriz CE, está el elemento £,;; pero, 
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en la matriz E;;C, en este sitio está el cero (en virtud de que i + j), 
de donde: cj; = 0, es decir, cualquier elemento de la matriz C, situa- 
do fuera de la diagonal principal, es igual a cero. El teorema está 
demostrado. 


$ 16, Construcción axiomática de la teoría 
de los determinantes 


Un determinante de n-ésimo orden representa un número, uní- 
vocamente determinado por una matriz cuadrada dada de n-ésimo 
orden. La definición de este concepto, expuesta en el $ 4, da la 
regla, según la cual el determinante se expresa mediante los elementos 
de la matriz dada, Sin embargo, esta definición constructiva se pue- 
de sustituir por una axiomática; mejor dicho, entre las propiedades 
del determinante establecidas en los $$ 4 y 6, se pueden indicar 
algunas, de modo que la única función de la matriz con valores rea- 
les que posea estas propiedades sea su determinante. 

La definición más simple de este género consiste en la utiliza- 
ción de los desarrollos del determinante por los elementos de una 
fila. Consideremos las matrices cuadradas de cualesquiera órdenes 
y supongamos que a cada matriz M de éstas se le ha puesto en corres- 
pondencia un número dx, cumpliéndose las condiciones siguientes: 

4) Si la matriz M es de primer orden, o sea, que consta de un 
elemento a, entonces dy = a. 

2) Si los elementos as, a + n forman la primera fila de la 
matriz M de n-ésimo orden y si se ha designado con M;, i = 1, 2, ..., 
n, la matriz de (n — 1)-ésimo orden que queda después de suprimir 
en M la primera fila y la ¿-ésima columna, entonces 


HD andin. 


dy = andu, — Ay dy + ad — 


Por lo tanto, para cualquier matriz M, el número dy es igual 
al determinante de esta matriz. La demostración de esta afirmación 
la dejamos a cuenta del lector. Esta se efectúa por el método de 
inducción sobre n y se basa en los resultados del § 6. 

Mucho más interesantes son otras formas de definición axiomá- 
tica de los determinantes, que se refieren al caso de un orden dado n 
y se basan en algunas de las propiedades simples de los determi- 
nantes, establecidas en el § 4. Examinaremos ahora una de estas 
definiciones. 

Supongamos que a cada matriz cuadrada M de n-ésimo orden se 
Pone en correspondencia un número dx, cumpliéndose las condicio- 
nes siguientes: 

I. Si una de las filas de la matriz M se multiplica por un núme- 
ro k, el número dy queda multiplicado por k. 
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1. El número dx no varía si a una de las filas de la matriz M 
se le agrega otra fila de esta matriz. 

III. Si E es la matriz unidad, entonces dy = 

Demostremos que para cualquier matriz M, T nimero du es 
igual al determinante de esta matriz. 

Establezcamos primero, partiendo de las condiciones I—II, 
unas propiedades del número dx, que son análogas a las propiedades 
correspondientes de los determinantes. 

(1) Si una de las filas de la matriz M consta de ceros, enton- 
ces du = 0. 

En efecto, multiplicando la fila compuesta de ceros por el núme- 
ro Ô, la matriz no varía. Sin embargo, en virtud de la condición I, 
el número dy adquiere el factor 0, de donde, 


dy =0-dy =0. 


(2) El número dy no varía si a lai-ésima fila de la matriz M se 
le agrega la j-ésima fila, j + i, multiplicada por el número k. 
= 0, todo está demostrado. Si k-40, multiplicamos la 
j Ter fila por k y obtenemos la matriz M’, para la que dw = 
kdy, en virtud de la condición 1. Después agregamos a la ¡-ósima 
fila de la matriz M’ su j-ésima fila y obtenemos la matriz M”, y en 
virtud de la condición II, se tiene dx- = dw. Finalmente, multi- 
plicamos la j-ésima fila de la matriz M” por el número k”*, obtenien- 
do la matriz M”, que en realidad resulta de M mediante la transfor- 
mación indicada en el enunciado de la propiedad que estamos demos- 
trando; además. 


dun = Kidu- = k’dy = -kdu = dar- 


(3) Si las filas de la matriz M son linealmente dependientes, 
entonces dy = 0. 

En efecto, si una de las filas, por ejemplo la ¿-ésima, es combina- 
ción lineal de las otras filas, entonces aplicando unas cuantas veces 
la transformación (2), se puede sustituir la ¿ésima fila por coros. La 
transformación (2) no altera el número dig, por lo cual, en virtud 
de la propiedad (1), se tiene da = O. 

(4) Si la i-ésima fila de la matriz M es la suma de dos vecto- 
res B y y, y si las matrices M' y M” se obtienen de la matriz M sus- 
tituyendo su i-ésima fila por los vectores B y y, respectivamente, 
entonces 


ds =dy + due. 


En electo, sea S el sistema de todas las filas de la matriz M, 
excluyendo la i-ésima. Si existe en S una dependencia lineal, las 
filas de cada una de las matrices M, M’ y M” son linealmente depen- 
dientes, de donde, por la propiedad (3), dy = dw = du- = 
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De aquí se deduce la validez de la propiedad en cuestión. Si el sis- 
tema S constituido de n — 1 vectores es linealmente independiente, 
entonces, como muestran los resultados del $ 9, éste se puede com- 
pletar con un vector æ de modo que resulte un sistema linealmente 
independiente maximal de vectores del espacio de n dimensiones. 
Los vectores B y y se pueden expresar linealmente mediante este 
sistema. Supongamos que el vector æ figura en esta expresión con 
los coeficientes k y l, respectivamente; por consiguiente, en la 
expresión del vector $ -+ y, o sea, en la i-ésima fila de la matriz 
M, el vector æ figurará con el coeficiente k 4- l. Ahora se pueden 
transformar las matrices M, M’ y M”, restando de sus ¿-ésimas 
filas ciertas combinaciones lineales de las otras filas, de modo 
que en las ¡-ésimas filas resulten los vectores (k + l)a, ka, y la, 
respectivamente. En consecuencia, designando con M° la matriz 
que resulta de la matriz M sustituyendo su ¿-ésima fila por el vec- 
tor æ, y, teniendo en cuenta las propiedades (2) y I, llegamos 
a las igualdades: 


dy= 


+1) due, due =kdue, du- = ldu. 


Con esto, la propiedad (4) queda demostrada. 

(5) Si la matriz M se ha obtenido de la matriz M trasponiendo 
dos filas, entonces di, = —d, 

En efecto, supongamos que en la matriz M hay que trasponer 
las filas que tienen los números de orden i y j. Esto se puede conse- 
guir mediante una cadena de transformaciones siguientes: primero 
agregamos a la i-ósima fila de Ja matriz M su j-ósima y obtenemos 
la matriz M’, resultando, por la condición II, dy» = dw. Después 
restamos de la j-ésima fila de la matriz M’ su i-ésima fila y obtene- 
mos la matriz M” para la que, en virtud de la propiedad (2), se tiene 
dw- = dw; la j-ósima fila de la matriz M” se diferenciará de la 
i-ésima fila de la matriz M en el signo. Agreguemos ahora a la i-ési- 
ma fila de la matriz M” su j-ésima fila, Para la matriz M” que se 
obtiene con esta transformación, por la condición II, se tiene dx- 
= dy», además, la i-ósima fila de esta matriz coincide con la 
j-ósima fila de la matriz M. Finalmente, multiplicando la j-ésima 
fila de la matriz M”, por el número —1, obtendremos la matriz 
buscada M. Por consiguiente, en virtud de la condición I, se tiene 


da=—dy»=—dy. 

(6) Si la matriz M’ se ha obtenido de la matriz M trasponiendo 
las filas, y la ¡-ésima fila de la matriz M”, 4,2,..., 7, es la 
arésima fila de la matriz M, entonces, 


dw = + da 
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donde el signo más corresponde al caso en que la sustitución 


(: F ai 2) 
i dz... On, 
es par, y el signo menos, al caso en que ésta es impar. 

En efecto, la matriz M’ se puede obtener de la matriz M reali- 
zando cierto número de trasposiciones de dos filas, pudiéndose, por 
consiguiente, aplicar la propiedad (5). Como se sabe por el $ 3, la 
paridad del número de estas trasposiciones determina la paridad de 
la sustitución indicada anteriormente. 

Veamos ahora las matrices M = (a1;), N = (b;;) y su producto 
Q = MN, en el sentido del $ 13, Hallemos el número d¿. Sabemos 
que cualquier ¿-ésima fila de la matriz Q representa una suma de 
todas las filas de la matriz M, tomadas con los coeficientes ai, 
aiz, »»=, Qin, respectivamente (véase, por ejemplo, el $ 14). Sustitu- 
yamos todas las filas de la matriz Q por sus expresiones lineales indi- 
cadas mediante las filas de la matriz N y apliquemos unas cuantas 
veces la propiedad (4). Obtendremos que el número dy será igual a la 
suma de los números dy para todas las matrices posibles 7' de la 
forma siguiente: la ¿ósima fila de la ma ,dmd, 2... ny es 
igual a la a,-ésima fila de la matriz M, multiplicada por el número 447. 
Además, en virtud de la propiedad (3), se pueden excluir todas las ma- 
tri T para las que existen unos índices ¿ y j, i j tales que a; = 

=æ y; en otras palabras, quedan solamente las matrices 7 para las que 
los Índices yy %2, ..., %, forman una permutación de los números 
1,2, ..., n. En virtud de las propiedades 1 y (6), el número dy para esta 
matriz tiene la forma 

dr = tareas > ++ Anandy, 

donde el signo se determina por la paridad de la sustitución de los 
índices. De aquí llegamos a la expresión para el número dy; después 
de sacar el factor común dy de todos los sumandos de la forma dy, 
entre paréntesis queda, evidentemente, el determinante 124 do la 
matriz M en el sentido de la definición constructiva dada en el 
$ 4, os decir, 


d¿=|M |- dy. (+) 
Si ahora tomamos por matriz X la matriz unidad Æ, se tendrá, Q = 
= M, de donde, por la propiedad III, dy = dp = 1, o sea para 
cualquier matriz M se cumple la igualdad 
dy=|M), 
que es lo que se quería demostrar. Simultáneamente, sin haber uti- 


lizado el teorema de Laplace, queda demostrado de nuevo el teorema 
del producto de los determinantes: para esto es suficiente sustituir 


110 Cap. III Algebra de las matrices 


los números dą y dy en la igualdad (*) por los determinantes de las 
matrices correspondientes. 

Terminemos estas consideraciones axiomáticas con la demos- 
tración de la independencia de las condiciones I—III, o sea, con la 
demostración de que ninguna de estas condiciones es consecuencia 
de las otras dos. 

Para la demostración de la independencia de la condición III, 
hagamos dy = 0 para cualquier matriz M de n-ésimo orden, Es 
evidente que las condiciones I y II se cumplen, mientras que la 
condición III no. 

Para la demostración de la independencia de la condición II, 
supongamos que para cualquier matriz M el número day es igual al 
producto de los elementos situados en Ja diagonal principal de esta 
matriz. Las condiciones 1 y II se cumplen, mientras que la condi- 
ción II ya no tiene lugar. Finalmente, para la demostración de la 
independencia de la condición I, hagamos dy = 1 para cualquier 
matriz M. En este caso, las condiciones I y ITI se cumplirán, mien- 
tras que la condición Í no. 


CAPITULO 1V 
NUMEROS COMPLEJOS 


$ 17. El sistema de los números complejos 


En el curso del álgebra elemental varias veces se efectúa un enri- 
quecimiento de las reservas de los números. El alumno que comienza 
el estudio del álgebra ya conoce por la aritmética los números ente- 
ros y quebrados positivos. En esencia, el álgebra comienza con la 
introducción de los números negativos, o sea, con la formación del 
primero de los sistemas numéricos fundamentales: del sistema de los 
números enteros que consta de todos los números enteros, positivos 
y negativos, incluyendo el cero, y del sistema más amplio de los 
números racionales, que consta de todos los números enteros y que- 
brados, tanto positivos como negativos, 

Posteriormente, se efectúa una ampliación del conjunto de Jos 
números introduciendo los números irracionales. El sistema, com- 
puesto de todos los números racionales e irracionales, so llama siste- 
ma de números reales. Ordinariamente, el curso universitario de 
análisis matemático contiene una construcción rigurosa del sistema 
de números reales; sin embargo, para nuestra exposición bastan los 
conocimientos de los números reales que tiene el lector que comienza 
a estudiar el álgebra superior. 

Finalmente, al terminar el curso del álgebra elemental, se amplía 
el sistema de números reales obteniendo el sistema de números com- 
plejos. Naturalmente, este sistema de números sigue siendo menos 
habitual para el lector que el sistema de números reales, a pesar de 
que posee unas propiedades muy útiles. En el presente capítulo se 
expondrá de nuevo la teoría de los números complejos con la exten- 
sión y plenitud debida, 

La introducción de los números complejos es debida al problema 
siguiente. Es sabido que los números reales no son suficientes para 
resolver cualquier ecuación cuadrática con coeficientes reales. La 
ecuación cuadrática más simple, que carece de raíces en el conjunto 
de los números reales, es 


+1 


1) 
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ahora, nos va a interesar solamente esta ecuación. El problema que 
se nos plantea es: hay que ampliar el sistema de números reales hasta 
obtener un sistema tal de números, en el que la ecuación (1) tenga 
ya raíz. 

Los puntos del plano se tomarán como material de construcción 
de este nuevo sistema de números. Recordemos que la representación 
de los númoros reales por puntos de una línea (basada en que se 
obtiene una correspondencia biunívoca entre el conjunto de todos 
los puntos de la recta y el conjunto de todos los números reales, al 
poner en correspondencia a cada punto de la recta su abscisa; se supo- 
nen dados el origen de coordenadas y la unidad de medida) se utiliza 
sistemáticamente en todas las ramas de las matemáticas y es tan 
habitual que, ordinariamente, no hacemos distinción alguna entre 
un número real y el punto que le corresponde. 

Por lo tanto, queremos definir un sistema de números que se repre- 
senten por todos los puntos del plano. Hasta ahora, no homos teni- 
do que sumar o multiplicar los puntos del plano, lo que nos da dere- 
cho de elegir la definición de las operaciones con los puntos, preo- 
cupándose solamente de que el nuevo sistema de números posea las 
propiedades que son el motivo de su creación. Al principio, estas 
definiciones nos parecerán artificiales, sobre todo la del producto. 
Sin embargo, en el capítulo X se demostrará que ningunas otras 
definiciones de las operaciones, incluso las que a primera vista 
parecen más naturales, nos conducirían al objetivo, que consiste 
en la construcción de una ampliación del sistema de números rea- 
les, para que la ecuación (1) tenga raiz. Allí mismo se demostrará 
que, en esta construcción, la sustitución de los puntos del plano por 
otro material, no nos conduciría a un sistema de números diferente, 
por sus propiedades algebraicas, del sistema de números complejos 
que vamos a construir a continuación. 

Supongamos que en el plano se ha elegido un sistema rectan- 
gular de coordenadas. Convengamos en designar los puntos del 
plano con las letras æ, B, y, ... y en representar con la notación (a, b) 
el punto æ de abscisa a y ordenada b, es decir, que apartándonos 
un poco de lo convenido en la geometría analítica, escribiremos 
a = (a, b). Dados los puntos œ = (a, b) y $ = (c, d), llamaremos 
suma de estos puntos al punto que tiene la abscisa a + e y la orde- 
nada b+ d, o sea, 


(a, b)+ (c, d) 


ac, b+ d); B 


llamaremos producto de los puntos «= (a, b) y P 
de abscisa ac—bd y ordenada ad- bc, o sea, 


(a, b) (c, d) 


(c, d) al punto 


(ac—bd, ad + bc). (3) 
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Do este modo, hemos definido dos operaciones algebraicas en el 
conjunto de todos los puntos del plano. Demostremos que estas 
operaciones poseen todas las propiedades principales que ellas mismas 
tienen en el sistema de números reales o en el sistema de números 
racionales, ambas son conmutativas y asociativas, están ligadas 
por la ley distributiva y para ellas existen las operaciones inversas: 
la resta y la división (ezcluyendo la división por cero). 

Las leyes conmutativa y asociativa de la suma son evidentes 
(o más exatamente, se deducen de las propiedades correspondientes 
de la suma de los números reales), puesto que al sumar los puntos 
en el plano, se suman por separado sus abscisas y sus ordenadas, 
La conmutatividad del producto se basa en que en la definición 
del producto los puntos « y f gozan de simetría. Las siguientes 
igualdades: 


tla, b) (c, d)l (e, $) =(ac—bd, ad + be) (e, f) = 

= (ace — bde —adf — bef, acf —bdf + ade + bee), 
(a, b) (ce—dj, cf + de) = 
= (ace—adf — bef — bde, acf + ade + bce— bdf), 


demuestran que para el producto se cumple la ley asociativa. La 
ley distributiva se deduce de las igualdades: 


L(a, b)+ (c, d) (e, P = (a+c, b+ d) (e, ) = 
= (ae + ce—b[—df, af + cf- be -+ de), 
(a, b) (e, ) +(e, d) (e, )=(0e—0f, af + be) + (ce—äf, cf -+ de) = 
=(ae—bj +ce—df, af4 be- ef -+ de). 
Veamos la cuestión de las operaciones inversas. Si se han 


dado los puntos æ= (a, b) y B=(c, d), su diferencia será un punto 
(z, y) tal que 


(a, 0) K(c, d) (e, PI 


(e, d) + (z, y) = (a, b). 
De aquí, en virtud de (2), se deduce que 

c+z=a, d+y=b. 
Por lo tanto, la diferencia de los puntos œ= (a, b) y B= (c, d) es 
el punto 

a—p=(a—c, b—d) 0) 
y esta diferencia queda definida unívocamente. En particular, 


el origen de coordenadas (0,0) sirve de cero, y el punto opuesto al 
punto a = (a, b) será el punto 


—a=( 


—b. 6) 


8-252 
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Supongamos ahora que se dan los puntos œ =;(a, b) y B = 
= (e, d), y que el punto f es diferente de cero, o sea, que al menos 
una de las coordenadas c, d no es igual a cero y, por consiguiente, 
c? + d* 0. El cociente de la división de a por B tiene que ser 
un punto (z, y) tal que (c, d) (z, y) = (a, b). De aquí, en virtud 
de (3), se tiene que, 


ez—dy=a, 
dz+cy=b. 


Resolviendo este sistema de ecuaciones, obtenemos: 


Por lo tanto, para p0, el cociente < existe y se determina uní- 


vocamente: 


es La década. w 


y apdr’ e 


$= 
Poniendo aquí f = &, obtenemos que en nuestra multiplicación 
de los puntos la unidad es el punto (1, 0), situado enel eje de abscisas 
ala distancia 4 del origen de coordenadas a la derecha. Poniendo 
luego en (6) œ = 1 = (1, 0), obtenemos que, para $ + 0, el punto 


opuesta a B es: 
E —d Es 
Plata: a)- m 


Por lo tanto, hemos construido un sistema de números repre- 
sentados por puntos del plano, donde las operaciones con ellos 
quedan definidas por las fórmulas (2) y (3); éste se denomina siste- 
ma de números complejos. 

Demostremos que este sistema representa una ampliación del 
sistema de números reales, Con este fin, veamos los puntos situa- 
dos en el eje de abscisas, o sea, los puntos de la forma (a, 0); ponien- 
do en correspondencia al punto (2, 0), el número real a, obtenemos 
evidentemente una correspondencia biunívoca entre el conjunto 
considerado de puntos y el conjunto de todos los números reales. 
(Véase la nota del T. en la pág. 25) La aplicación de las fórmu- 
las (2) y (3) a estos puntos proporciona las igualdades 

(a, 0) + (6, 0) = (a + ù, 0), 
(a, 0)-(b, 0) = (ab, 0), 
o sea, los puntos (a, 0) se suman y se multiplican entre sí, igual que 
los números reales correspondientes. Por lo tanto, el conjunto de 
puntos situados en el eje de abscisas, considerado como una parte 
del sistema de números complejos, no se diferencia en nada por sus 
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propiedades algebraicas del sistema de números reales, representado 
ordinariamente por puntos de una recta. Esto nos permite no hacer 
a continuación ninguna distinción entre el punto (a, 0) y el número 
real a, o sea, que pondremos (a, 0) =a. En particular, el cero (0, 0) 
y la unidad (1, 0) del sistema de números complejos resultan ser los 
números reales ordinarios 0 y 1. 

Tenemos que mostrar ahora que entre los números complejos 
está contenida una raíz de la ecuación (1), es decir, un número cuyo 
cuadrado sea igual al número real —1. Este será, por ejemplo, el 
punto (0, 4), o sea, el punto situado en el eje de ordenadas a la 
distancia 1 del origen de coordenadas, hacia arriba. En efecto, 
aplicando (3), obtenemos: 


(0, 1)-(0, 1) =(—1,0)=—1. 


Designemos este punto con la letra i, de modo que i? = 1. 
Finalmente, demostremos que para los números complejos in- 
troducidos se puede obtener su expresión ordinaria. Para esto, ha- 
llemos primero el producto del número real b por el punto i. 
bi=(b, 0)-(0, 1) =(0, 0); 
por consiguiente, éste es el punto que tiene la ordenada b y está 
situado en el eje de ordenadas; además todos los puntos del eje 
de ordenadas se representan en forma de productos de éstos, Si 
ahora (a, b) es un punto arbitrario, en virtud de la igualdad 


(a, b)=(a, 0) + (0, b), 


se tione: 
(a, d)=a+ bi, 


o sea, que verdaderamente llegamos a la expresión ordinaria de 
los números complejos; por supuesto, en la expresión a + bi, la 
suma y el producto se deben entender en` el sentido de las opera- 
ciones definidas en el sistema de números complejos construido, 

Una vez introducidos los números complejos, el lector com- 
probará fácilmente que todo el contenido de los capítulos preceden- 
tes del libro (la teoría de los determinantes, la teoría de los siste- 
mas de ecuaciones lineales, la teoría de la dependencia lineal de 
los vectores y la teoría de las operaciones con las matrices) se 
generaliza sin restricciones al caso en que se permite el uso de 
cualesquiera números complejos, y no sólo de los números reales, 

Por último, obsérvese que Ja construcción expuesta del siste- 
ma de números complejos nos lleva a la siguiente pregunta: ¿Se 
puede definir la suma y el producto de los puntos del espacio de 
tres dimensiones, de modo que el conjunto de éstos forme un siste- 
ma de números que contenga al sistema de números complejos o, al 
menos, al sistema de números reales? Esta cuestión sale fuera de 


gr 
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los márgenes de nuestro curso y solamente señalaremos que la res- 
puesta es negativa. 

Por otra parte, observando que la suma de Jos números comple- 
jos definida anteriormente coincide en su esencia con la suma de 
vectores en el plano que parten del origen de coordenadas (véase 
el siguiente párrafo), resulta natural la siguiente pregunta: ¿Es 
posible definir para ciertos valores de n el producto de vectores del 
espacio vectorial real de n dimensiones, de modo que éste sea, con 
respecto a esta multiplicación y a la adición ordinaria de los vecto- 
Tes, un sistema numérico que contenga al sistema de números rea- 
les? Se puede demostrar que esto no se puede hacer si se quiere que 
se cumplan todas las propiedades de las operaciones que tienen 
lugar en los sistemas de números racionales, reales y complejos. 
En el espacio de cuatro dimensiones esta construcción es posible 
si se prescindo de la conmutatividad de la multiplicación; el siste- 
ma de números obtenido se denomina sistema de cuaterniones. Tan- 
bién es posible una construcción análoga en el espacio de ocho 
dimensiones, resultando el llamado sistema de números de Cayley. 
Desde luego, en este caso no hay que prescindir solamente de la 
conmutatividad del producto, sino también de su asociatividad, 
sustituyendo esta última por otra menos rigurosa. 


$ 18. Estudio posterior de los números complejos 


De acuerdo a la tradición histórica, al número complejo i lo 
llamaremos unidad imaginaria, y a los números de la forma bi, 
números imaginarios puros, a pesar de que no dudamos de la exis- 
tencia de ellos, pudiendo señalar los puntos del plano (que están 
en el eje de ordenadas) que los representan. En la expresión del 
número complejo æ en la forma æ = a + bi, el número a se deno- 
mina parte real del número a, y el número bi, parte imaginaria. 
El plano, cuyos puntos se han identificado con los números com- 
plejos según el método expuesto en el $ 47, se llamará plano com- 
plejo. El eje de abscisas de este plano se llama eje real, puesto que 
sus puntos representan a los números reales; respectivamente, el 
eje de ordenadas del plano complejo se lama eje imaginario. 

La suma, resta, multiplicación y división de los números com- 
plejos expresados en la forma a + Bi, como se deduce de las fórmu- 
las (2), (4), (3), y (6) del párrafo anterior, se efectúan del modo 
siguiente: 


(abi) + (e+ di) = (a +6) + (6 +d) i; 

(a+ bi) + (c—di)=(a—c) + (b~d) i; 
(a + bi) (e + di) = (ac — bd) + (ad + be) i; 
abi ac ba bc—ad 
Fa ajat aye 
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Se puede decir que al sumar los números complejos, se suman por 
separado sus partes reales y sus partes imaginarias; para la resta se 
cumple una regla análoga. Las expresiones verbales de las fórmu- 
las para multiplicar y dividir serían muy complicadas y las omiti- 
mos. No hay necesidad de recordar la última de estas fórmulas: 


solamente hay que tener en cuenta que ésta se puede deducir mul- 
tiplicando el numerador y denominador del quebrado dado por 
un número, que se diferencia del denominador solamente por el 
signo de la parte imaginaria. 


En efecto, 
at-bi la bd (edi) _ (ac | bd) (be—ad)i _ ao bd 
eydi ~ (er di) (=d) — cE dë Tg d? 
Ejemplos. 


1) (2450) +(1—7i) = (2+1) 4- (5—7)i =3— 2i; 

2) (39) —(7 +) =(3—)+(—9—1)t = —4— 10i; 

3) (142) (80) =11-3-2-(-4)1 +11 (—1) 42-31 = 54+ 5i; 
a h 23B) _ 10—20 
4) 1 BB) 1 


La representación de los números complejos por puntos del pla- 
no conduce al deseo natural de obtener una interpretación geomé- 
trica de las operaciones definidas’ para los números complejos. 
Esta es fácil de lograr para la suma. Sean dados los números a = 
=a + bi y B = c + di. Unamos con segmentos el origen de coor- 
denadas con los puntos (a, b) y (c, d) correspondientes a dichos 
números, y sobre estos segmentos, como lados, trazemos un paralelo- 
gramo (fig. 2). Es evidente que el cuarto vértice de este paralelogramo 
será el punto (a +c, b-+d). Por lo tanto, la suma de números 
complejos se efectúa geométricamente por la regla del paralelogramo, 
o sea por la regla de la suma de vectores que parten del origen de 
coordenadas. 
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El número opuesto al número a. = a + bi es el punto del plano 
complejo que es simétrico al punto œ con respecto del origen de coor- 
denadas (iig. 3). De aquí se puede obtener sin dificultad alguna 
la interpretación geométrica de la resta. 

La interpretación geométrica de la multiplicación y división 
de los números complejos quedará clara solamente después de que 
introduzcamos una nueva expresión para los números complejos. 
Para la expresión del número æ en la forma a = a -+ bi utiliza- 
mos las coordenadas cartesianas del punto correspondiente a este 

número. Sin embargo, la posición del punto 

1 en el plano queda también determinada, si se 
conocen sus coordenadas polares: la distancia 
r del origen de coordenadas al punto y el 
ángulo y que forma la dirección positiva del 
eje de abscisas con la dirección que va desde el 
origen de coordenadas hacía este punto (fig. 4). 

El número r es real y no negativo, siendo 
además igual a cero solamente para el punto 0, 
Para un número æ situado en el cje real, 
o sea, para un número real, el número r es el 
valor absoluto de a; por esto, a veces, para 
cualquier número complejo æ, a r también se le llaman valor absoluto 
o módulo del número æ, representándose por la notación |æ |. 

El ángulo q se llamará argumento del número æ y se designará 
con la notación: arg a*, El ángulo q puede tomar cualesquiera 
valores reales, ento positivos como negativos, teniendo que medir- 
se los ángulos positivos en dirección contraria a la del movimien- 
to de las agujas del reloj; sin embargo, si los ángulos se diferencian 
entre sí en 2x o en un número múltiplo de 2x, sus puntos corres- 
pondientes del plano coinciden. 

De esto modo, el argumento de un número complejo œ tiene 
infinitos valores, que se diferencian entre sí en números enteros 
múltiplos de 27; por consiguiente, de la igualdad de dos números 
complejos, representados por sus módulos y sus argumentos, sola- 
mente se puede hacer la conclusión de que sus argumentos se dife- 
rencian en un número entero múltiplo de 2x, mientras que sus módu- 
los son iguales. Solamente para el número Ô el argumento es indefi- 
nido; sin embargo, este número queda completamente determinado 
por la igualdad: 0] = 0. 

El argumento del número complejo es una generalización natu- 
ral del signo del número real. En efecto, el argumento de un número 
real positivo es igual a cero, el argumento de un número real nega- 


Fig. 4. 


* No recurrimos a las denominaciones corrientes de las coordenadas pola- 
ros: radio polar y ángulo polar. f 
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tivo es igual a a; en el eje real, del origen de coordenadas parten 
solamente dos direcciones, las cuales se pueden distinguir por los 
símbolos: + y —. En el plano complejo hay infinitas direcciones 
que parten del punto O, diferenciándose por el ángulo que forman 
con la dirección positiva del eje real. 

Las coordenadas cartesianas y polares de un punto están liga- 
das por las relaciones siguientes: 

a=rcosq, b=rsen p, a) 

que se cumplen independientemente de la posición del punto en el 
plano. 
De aquí que 


r=+VaFF. (2) 
Apliquemos las fórmulas (1) a un número complejo arbitrario 
0 =4+ bi: 


a=a + bi =r cos q + (rsen p) i, 


o sen, 
a= r (cosg -+ isen 4). 8) 


Recíprocamente, supongamos que el número « = a + bi se 
expresa en la forma æ = ro (cos qo + ¿sen Po), donde ra y qo son 
unos números reales, siendo ry > 0. Eutonces, ro cos Po = 4, 
ro sen Po = b, de donde ro = + Va? F Ù, y, en virtud de (2), 
ro=|a|. De aquí, aplicando (1), obtenemos: cos o = cos ọ, 
son Po = sen q, o sea, po = arga. Por lo tanto, todo número com- 
plejo œ se expresa univocamente en la forma (3), donde r=]|a |, 
«y = arg a (por supuesto, el argumento p está definido salvo 
un sumando, múltiplo de 2a). Esta expresión del número a se llama 
forma trigonométrica y se empleará frecuentemente a continuación, 


Los números 
n 
a=3 (cos ža 


v=V3 | cos (- 5) +i sen (-5)] 


están dados on forma trigonométriea; aquí, |aļ=3, |B|=1, 111V3; 
a 1 3 
agami agp, ar i 5 (o bien, arg pi yn 
Por otra parte, los números complejos 
Ea 
pereg ) * 


y =2 (cos 3 hisen a) „ò son Pt icos ha 


i aj 


ya no están dados en forma trigonométrica, a pesar de que estas expresiones se 


x PAR 
A 
miami), wet (tarima) 


nd ARE 
Sen cbr cel 
RRE 
a tanap yoy + 


Aer toni 9 o 

Bamas, un er, 

OS 
AT o 

o ud ra poemes ll. 

dio e ads e Jos pa ls pro a 


OA 


TAR e 98 nt sv sat, at 


w 
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O sea, 


(1 


(8) 


es decir, el módulo del cociente de dos números complejos es igual al 
módulo del dividendo dividido por el módulo del divisor; por otra parte, 
arg ($) =9— 9, o sen, 

arg ($) -arga—argf (9) 


es decir, el argumento del cociente de dos números complejos se obtiene 
restando el argumento del divisor del argumento del dividendo. 

El significado geométrico del producto y del cociente se acla- 
ra ahora sin dificultad. En efecto, en virtud de las fórmulas (5) 


Ll 1 


CA. 
TYI 


Fig. 5. Fig. 


añ 


y (6), para obtener el punto que representa el producto del número 
a por el número f — r’ (cos ¿sen q”), hay que hacer girar al vector 
que va de 0 a æ (fig. 5) un ángulo q" arg f en dirección contraria a 
la del movimiento de las agujas del reloj, y después hay que alargar 
este vector r’ = | È | veces (si 0< r’ < 1, esto no será un alargamiento, 
sino una contracción). Por otra parte, de (7) se deduce que para 
æ= r (cos p -+i sen q) +06, se tiene, 

at= r! [cos (—4) + ¿sen (— ql, (10) 


o sea, Ja] = |a], arg (a) = —arga, Por lo tanto, para obte- 
ner el punto at hay que pasar del punto a al punto a”, situado 
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en la misma semirrecta que parte del cero y que pasa por el pun- 
to a, a la distancia r% del cero (fig 6)*, y después hay que pasar 
al punto simétrico a a” con respecto al eje real. 

La suma y la diferencia de números complejos, dados en forma 
trigonomélrica, no se pueden expresar por fórmulas semejantes 
a las fórmulas (4) y (7). Sin embargo, para el módulo de la suma se 
cumplen las importantes desigualdades: 


la|1B]<J]a+8]<l0]+1B1 (11) 


es decir, el módulo de la suma de dos números complejos es menor 
o igual a la suma de los módulos de los sumandos, pero es mayor o igual 
a la diferencia de estos módulos. Las desigualdades (11) se dedu- 
cen del conocido teorema de geometría elemental sobre los lados 
del triángulo, puesto que como se sabe, | œ + B | es igual a la dia- 
gonal del paralelogramo de lados |a| y |B|. Si los puntos a, $ y 0 
están situados en una recta, se necesita un estudio especial; esto 
lo dejamos a cuenta del lector. Solamente en este caso se cumple el 
signo de igualdad en las fórmulas (14). 
Como a—P=a-+(—B) y 
I—=B1=1B1 (12) 
(esta igualdad es consecuencia de la interpretación geométrica 
del número —f), de (11) se deducen también las desigualdades 
laj—IP|<la—P]</2]4+18), * (13) 


es decir, para el módulo de la diferencia se cumplen también las 
mismas desigualdades que para el módulo de la uma. 


Las desigualdades (11) so podrían obtener, también del modo siguiente: 
Sea a (cos p + i son q), B = 7' (cos q" + i sen y”); supongamos que 
la forma trigonométrica del número a + fi es: a + B = R (cos p + isen y). 
Sumando por separado Las partes reales y las partos imaginarias, obtenemos: 
r cos p+r’ cos g'= R cosp, 
rsen p+r’ sen g'— R sen yi 


multiplicando ambos miembros de la primera igualdad por cos p, ambos miem- 
bros de la segunda por son Y y sumando, obtenemos: r (cos q cos -+ 


* La igualdad |a’ |=]la | se cumple cuando, y sólo cuando |aļ=1, 0 sea, 
si ol punto está situado en la circunferencia del círculo unidad. Si æ está situa- 
do dentro del círculo unidad, a’ estará situado fuera do él, y viceversa, obte- 
niendo de este modo una correspondencia biunivoca entro todos los puntos del 

lano complejo, situados fuera del círculo unidad, y todos los puntos, situados 
dentro do esto circulo y diferentes de cero. 

*s Por consiguiente, se cumple también la desigualdad 


Pal=iBl|<a—8t 
que se aplicará en el $ 23. (Nota de T.) 
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sen q sen 4)+r' (cos p” cos sen q” sen yy) = R (cos? p + son? y), 
o sea, 
rcos(p—4)+r' cos (p'—4) =R. 
Como el coseno nunca es mayor que la unidad, de aquí se deduce la desigualdad 


Er>R, o sea, |a] IBI >la +f]. Por otra parte, a = 
a E E e a demostrado y En A 


lal <la+PI+1—Bl=124B+18l 
de donde |a]—]ĝl:Sla+p]. 


Es menester observar que los conceptos «mayors y «menor» 
no se pueden definir racionalmente para los números complejos, 
puesto que éstos, a diferencia de los números reales, no so sitúan 
en una recta, cuyos puntos están ordenados de un modo natural, 
sino en un plano. Por esto, los números com- 
plejos (no nos referimos a sus módulos) no se 7 
pueden unir nunca con el signo de desigualdad. 

Números conjugados. Sea dado un número 
complejo a =a + bi. El número a — bi, que 
so diferencia de œ solamente en el signo de la 
parte imaginaria, se Mama número conjugado 
de æ y se designa pora. 

Recordemos, que al estudiar la división de 
los números complejos recurríamos a los núme- 
ros conjugados, a pesar de que no habíamos 
introducido esta denominación. 

Es evidente que el número conjugado de © 
es œ, es decir, se puede hablar de pares de n 
números reales, y solamente éstos, son conjugados consigo mismos. 

Geométricamente, los números conjugados son puntos simétri- 
cos entre sí con respecto al eje real (fig. 7). De aquí se deducen las 
igualdades 


ja |, arga = —arg a. (14) 


La suma y el producto de números complejos conjugados son 
números reales. lin efecto, 


a. a=20x, 


a+ i=jaj ea 


an 


La última igualdad muestra que el número az es, incluso, posi- 
tivo para æ = 0. En el $ 24 se verá un teorema que muestra que la 
propiedad que acabamos de demostrar de los números conjugados 
es característica para éstos. 
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La igualdad 
(abi) +(c—di)=(a+0)—(b+d) 1 


muestra que el número conjugado de la suma de dos números es igual 
a la suma de los números conjugados con los sumandos: 

aP=arf. (16) 
Análogamente, de la igualdad 


(a—bi) (e—di)= (ac — bd) —(ad y be) i 


resulta que el número conjugado con producto es igual al producto 
de los números conjugados con los factores: 


ap=a-B. (17) 


Una comprobación directa muestra que se verifican también las 
igualdades 
(18) 


(19) 


Demostremos también la siguiente proposición: si el número a se 
expresa de cierto modo por los números complejos By, Ba, ..., Bn 
mediante la suma, el producto, la resta y la división, entonces, al 
sustituir en esta expresión todos los números þa por sus conjugados, 
se obtiene el número conjugado de a; en particular, si el número 
e es real, éste no se altera al sustituir todos los números complejos 
Ba por sus conjugados. 

Esta proposición la demostraremos por inducción sobre n, puesto 
que para n = 2 ésta se deduce de las fórmulas (16)—(19). 

Supongamos que el número æ se expresa por los números 

1 Bes ---+ Bn, que no son necesariamente diferentes. En esta expro- 
sión hay un orden determinado de aplicación de las operaciones 
de sumar, multiplicar, restar y dividir. El último acto consistirá en 
la aplicación de una de estas operaciones a un número y,, expresado 
mediante los números By, Ba, ..., Pa, donde 1 < k < n —1, y a un 
número ya, expresado mediante los números B+, +. -+ Ba. Por la 
hipótesis de inducción, la sustitución de los números By, Br 
por los conjugados implica el cambio del número y, por yı, y la 
sustitución de los números Ba+1 Baro, - --, Pa por los conjugados, 
el cambio del número yz por y». Pero, según una de las fórmulas 
(16) —(19), el cambio de y, y Yz por Yı y Yz convierte al número æ 
en el número z. 
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Estudiemos el problema de la elevación de los números com- 
plejos a una potencia y de la extracción de una raíz. Para elevar el 
número œ = a + bi a una potencia entera y positiva n, es sufi- 
ciente aplicar la fórmula del binomio de Newton a la expresión (a + 
+ bi)" (esta fórmula subsiste también para los números complejos, 
puesto que su demostración se basa solamente en la ley distributi- 
va), y después, las igualdades: i? = —4, ¡%=— = 1; en general 


ad, pu ¿aho zi 


Si el número æ está dado en forma trigonométrica, entonces, 
siendo n entero y positivo, de la fórmula (4) del párrafo anterior 
resulta la fórmula siguiente, llamada fórmula de Moivre: 


Ir (cos q + isen q)" =r” (cos ng +i sen ng), a) 


o sea, que al elevar un número complejo a una potencia, se eleva el 
módulo a esta potencia y se multiplica el argumento por el exponente 
de la potencia. La fórmula (1) es válida también para los exponen- 
tes enteros negativos. En efecto, en virtud de la igualdad ar” 
= (a7)", es suficiente aplicar la fórmula de Moivre al número a” 
cuya forma trigonométrica viene dada por la fórmula (10) del párr: 
fo anterior. 

Ejemplos. 

1) Ml, Pm 4; 

2) (2-1 51)9 2% 13.22.51 4-3.2.5%? 4 5 = 

8-1 601 —150 — 125i = —142— 654; 


3 [V2 (cos Jl =(V 21 (cos a+ i sen x) 
4) [3 (cos -$i sen 5) ]*= 
39 [cos (4 


De la igualdad 


—4; 


bd 
(eos Fx+isont a) 


(cos q + ¿sen p)” = cos ng 4- ¿sen np, 


que representa un caso particular de la fórmula de Moivre, fácil- 
monte se obtienen las fórmulas para el seno y el coseno de un ángulo 
múltiplo. En efecto, aplicando la fórmula del binomio de Newton 
al primer miembro de esta igualdad e igualando por separado las 
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partes reales e imaginarias de ambos miembros, se tiene: 
cosmp==cos" p— (3) costapusent y + (3) cos™=g-sento— -<-> 
sen ng = (7) cos" -sen y— ($) cos" q-sen q- 
+ (2) cos=g-sentg— » -3 


aquí (i) es la notación ordinaria del coeficiente binomial 


+1 

1-2 E 

Para n=2, se tienen las conocidas fórmulas 
cos 2 =c0s* q — sen? p, 
sen 2 = 2 cos qp sen q; 

para n=3, 

3 cos «y senta, 


sen 34 = 3 cos* q sen y —sen? q. 


cos 3 = cos? p 


La extracción de la raíz de los números complejos es mucho 
más complicada. Comencemos por la extracción de la raíz cuadrada 
del número œ = a + bi, Todavía no sabemos si existe un número 
complejo cuyo cuadrado sea igual a æ. Suponiendo que tal número 
existe, por ejemplo, u + vi y empleando la notación ordinaria, se 
puede escribir: 

Vapbi=u4vi. 
De la igualdad 

(e + vi)? =a+ bi 
resulta, 


2uv=b, a 


Elevando al cuadrado ambos miembros de las igualdades (2) 
y sumándolas después, se tiene 


ue — o ut (Ra, 


u?—i? =a, ) 


de donde 
qe +VEFE, 


se toma el signo más, porque los números u y v son reales, debido 
a lo cual, el primer miembro de la igualdad es positivo. De esta igual- 
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dad y de la primera de las igualdades (2), resulta: 
(+ VEFR), 
“TA a+ VEFE). 


Extrayendo' las raíces cuadradas se obtienen dos valores para w, que 
se diferencian en el signo, y también dos valores para v. Todos estos 
valores son reales, puesto que para cualesquiera a y b, las raíces 
cuadradas se extraen de números positivos. Los valores obtenidos 
de u y v no se pueden combinar entre sí de modo arbitrario, puesto 
que, en virtud de la segunda de las igualdades (2), el signo del pro- 
ducto uv tiene que coincidir con el signo de b. Resultan, pues, dos 
combinaciones posibles de los valores de u y v, o sea, dos números 
de la forma u + vi, que pueden servir de valores de la raíz cua- 
«rada del número a; estos números se diferencian entre sí en el signo. 
Una prueba elemental, aunque complicada (elevando al cuadrado 
los números obtenidos, una vez cuando b > 0, y otra vez cuando 
b< 0), muestra que los números obtenidos son, verdaderamente, 
valores de la raíz cuadrada del número æ. Por lo tanto, siempre es 
posible la extracción de la raíz cuadrada de un número complejo, 
proporcionando ésta dos valores/que se diferencian entre si en el signo, 

En particular, ahora resulta posible la extracción de la raíz 
cuadrada de un número real negativo, siendo los valores de esta 
raíz números imaginarios puros. En efecto, si a<4 y 6=0 
entonces Va? 12 = —a, puesto que esta raíz tiene que ser posi 


tiva, por lo cual, u? = que Va = + 


a) = 0, o sea, u = 0, as 


ALO 29, 


Ejemplo. Sea a = 24 


i. Entonces Var 02= yI 
Por consiguiente, u?— L (214 


(—214-29)=4, de donde 


u= 5,0 = 4 2, Los signos de u y v tienen que ser diferentes, puesto que 
v es negativo; en consecuencia, 


V3 — 20i = + (5—2). 


Las pruebas de extracción de raíces de grado más elevado de los 
números complejos, dados en la forma a + bi, chocan con dificul- 
tades insuperables. Así, pues, si quisiéramos hallar con el mismo 
método la raíz cúbica del número a — bi, tendríamos que resolver 
una ecuación cúbica auxiliar, cosa que por el momento no sabemos 
hacer y que, como ya veremos en el $38, requiere a su vez la extra 
ción: de la raíz cúbica de números complejos. Por otra parte, la 
forma trigonométrica se adapta perfectamente para la extracción 
de las raíces de cualquier grado, con cuya aplicación se resuelve 
totalmente este problem. 
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Supongamos que se necesita extraer la raíz n-ósima del número 
a — r (cos p -+i sen 4). Supongamos también que ésta se puede 
hallar, resultando p (cos 0 + ¿ sen 0), de modo que, 


lp (cos 0 + ¿sen 0)]" = r (cos q + ¿sen 4). (3) 


Según la fórmula de Moivre, p” = r, o sea, p = y7, donde en 
el segundo miembro figura el valor positivo, univocamente deter- 
minado, de la raíz 2-ésima del número real positivo r. Por otra par- 
to, el argumento del primer miembro de la igualdad (3) es n0. Sin 
embargo, no se puede afirmar que n0 es igual a (p, porque, en reali- 
dad, éstos pueden diferir en un sumando que es múltiplo entero 
del número 21, En consecuencia, 20 = p + 2ka, donde k es entero y 

0- 2kn 


an 2 p42 
amente, tomando el número y7 (cos EE2E 4 ¿sen erza), 
se tiene que, para cualquier k entero, positivo o negativo, la n-ésima 


potencia de este número es igual a a. Por lo tanto 
E (4) 


Recípr 


Vr (cos q + iseng) = y 7 (cos 


Dando a k diversos valores, no siempre se obtienen diversos 
valores de la raíz buscada. En efecto, para 


0,1,2,...,n—1 (5) 
se obtienen n valores distintos de la raíz, puesto que el aumento de l 


E E 2n 
en una unidad ocasiona un aumento del argumentos en 7 Supon- 


gamos ahora que k es arbitrario. Si k = nq + r,0< +r<n —1, 
se tiene, 


es decir, el valor del argumento para nuestro k difiere del valor 
del argumento para k = r en un número múltiplo de 2x; por consi- 
guiente, se obtiene el mismo valor de la raíz que resulta para el 
valor de ke igual a r, incluido en el sistema (5). 

Por lo tanto, siempre es posible la extracción de la raíz n-ésima 
de un número complejo œ, resultando n valores distintos. Todos los 
valores de la raíz n-ésima están situados en una circunferencia de 
radio Y Ta| con el centro en el cero, dividiendo a ésta en n partes 
iguales. 

En particular, la raíz n-ésima de un número real a tiene tam- 
bién n valores distintos; entre éstos puede haber dos reales, uno 
o ninguno, dependiendo del signo de a y de la paridad de z. 
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Ejemplos. 
1) p= ý? (eos ha-+1sen= a) = 


3 3 
E nizka {rtz 
-palain 7 dis a, 
3 
0: B2=Y7 (00 ay. 
k=0: Bo=2 (cos + isen $) ; 
k= : Bi=/Z (costi a+ isendit de 


ee 
k=2: e= V/Z (cos 2 a+ ¿sen t2 tx) . 


12 
=Y o 


= cos 


a 


4 
Bi =cos $ n- iseng r= — Po. 
3) p= 8 =y 8 (cosa F isen a) = 
= 2 (cos -FERT i i sen FLAT); 
Bo = 2 (cos 


Pi = 2 (cos n + ¿sen x) = 


Bo = cos + isen 


isen $) = 
a 
Sn 


Ba=2 (cos 2h Hi sen SE 


Raíces de la unidad. El caso de la extracción de la raíz n-ésima 
del número 4 es de particular importancia. Esta raíz tiene n valo- 
res y, en virtud de la igualdad 1 = cos O + ¿ sen O y de la fórmu- 
la (4), todos ellos, o, como nos expresaremos, todas las raices n-ési- 
mas de la unidad, vienen dadas por la fórmula 

VA =cos 20 isen 25; k=0,1,.. 0—1. (6) 
Los valores reales de la raíz n-ósima de la unidad se obtienen de la 
fórmula (6) para los valores k= 0 y $, si n es par, y para k = 0, 
si n es impar. En el plano complejo las raíces n-ésimas de la unidad 
9-252 
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estánTsituadas en la circunferencia del círculo unidad y la dividen 
en narcos iguales; el número 1 es uno de los puntos de división. 
De esto se deduce que las raíces n-ésimas de la unidad que no son 
reales están situadas simétricamente con respecto al eje real, es 
decir, son conjugadas entre sí. 

La raíz cuadrada de la unidad tiene dos valores: 1 y —-1, La 
raíz cuártica de la unidad tiene cuatro valores; 1, —1, ¿ y —i. Para 
lo futuro es conveniente recordar los valores de la raíz cúbica 


E A sas A 2km 
de la unidad, En virtud de (6), éstos son los números cos “y -+ 
2 
-+i sen 
tienen los números conjugados entre sí 


Bi y 
z ti sen 


a n a 
, donde k = 0, 1,2, o sea, además de la unidad, se 


1 


os 


A] 


cos +i sen 


Todos los valores de la raíz n-ésima del número complejo œ se 
pueden obtener multiplicando uno de estos valores por todas las 
raíces n-ésimas de la unidad. En efecto, sea P uno de los valores de la 
raíz n-ósima del número a, o sea, que B® = a, y sea e un valor arbi- 
trario de la raíz n-ésima de la unidad, o sea, que e” = 1, Entonces, 
(Be)” = P"e" = q, es decir, Be también es uno de los valores de V. 
Multiplicando ß por cada una de las raíces n-ésimas de la unidad, 
obtenemos n valores diferentes de la raíz n-ósima del número &, 
o sea, todos los valores de esta raíz. 


Ejemplos. 1) Uno de los valores de la raíz cúbica de —8 es —2, En virtud 
de (7), los otros dos serán los números —2e, == 1 — i V3 y —2es = 1 + i V3 
(véase el ejemplo anterior 3). 2) $/81 tiene cuatro valores: 3, —3, 3i, —3i. 


El producto de dos raíces n-ésimas de la unidad tambiénesuna raíz 
n-ésima de la unidad. En efecto, si e”=1 y n"=1, se tiene, (en)” 
= en" = 1. Por otra parte, el número recíproco de la raíz n-ésima 
de la unidad también es una raíz n-ésima de la unidad. En efecto, sea 
e” = 41, Entonces, de la igualdad e”. e”! = 1 resulta, e” (e“l)" 
= 1, o sea, (e71)" = 1. En general, toda potencia de la raíz n-ésima 
de la unidad también es una raíz n-ésima de la unidad. 

Toda raíz k-ésima de la unidad también es raíz l-ésima de la 
unidad para cualquier /, múltiplo de k. De esto se deduce que, con- 
siderando todo el conjunto de las raíces n-ésimas de la unidad, 
algunas de estas raíces también son raíces n'-ésimas de la unidad 
para ciertos n’, divisores del número n. Sin embargo, para todo n 
existen raíces n-ésimas de la unidad que no son raíces de la unidad 
de orden menor. Estas se llaman raíces primitivas n-ésimas de la 
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unidad. Su existencia se deduce de la fórmula (6): si se designa 

con e, el valor de la raíz que corresponde al valor dado de / (de modo 

que eo = 1), en virtud de la fórmula de Moivre (1), se tiene: 
e= eno 

Por consiguiente, ninguna potencia del número es, menor que la 

n-ósima, será igual a 1, o sea, el número e; = cos = -+ i sen Y 

es una raíz primitiva. 

La raíz n-ésima de la unidad e es primitiva cuando, y sólo cuan- 
do, sus potencias e", k = 0,1, ..., n — 1, son diferentes, es decir, si 
con ellas se agotan todas las raíces n-ésimas de la unidad. 

En efecto, si todas las potencias indicadas del número e son 
diferentes, es evidente que éste es raíz primitiva n-ésima de la uni- 
dad. Si, por el contrario, e*=el para 0<k<Ii<n-—41 
entonces, el * = 1, y en virtud de las desigualdades 7 <1— 
—k<n—1, la raíz e no será primitiva, 

En el caso general, el número e, hallado anteriormente no será la 
única raíz primitiva n-ésima de la unidad. Para hallar todas estas 
raíces se aplica el teorema siguiente: 

Si e es una raíz primitiva n-ésima de la unidad, el número e" 
es una raíz primitiva n-ésima de la unidad cuando, y sólo cuando, k 
es primo con n. 

En efecto, sea d el máximo común divisor de los números k y n. 
Si d>1 y k= dk', n = dn’, entonces, 


(et =en mern A, 
o sea, la raíz e" resulta raíz n'-ésima de la unidad. 


Por otra parte, supongamos que d = 1 y que el número e 
una raíz m-ésima de la unidad, 1 < m < n. Por lo tanto, 


(Arat. 


los 


Como el número e es una raíz primitiva n-ésima de la unidad, lo que 
implica que pueden ser iguales a la unidad solamente las potencias 
del mismo cuyos exponentes sean múltiplos de z, el número km es 
múltiplo de n. Sin embargo, como 1<m<n, resulta que los números 
k y n no pueden ser primos entre si, lo que contradice a la hipóte- 
sis, Por lo tanto, el número de raíces primitivas n-ésimas de la un 
dad es igual al número de enteros positivos k, menores de n y pri 
mos con k. La expresión de este número que, generalmente, so desig- 
na mediante q (n), se puede hallar en cualquier tratado sobre la 
teoría de los números. Si p es un número primo, todas las raíces 
p-ésimas de la unidad son primitivas, a excepción de la unidad 
misma. Por otra parte, entre las raíces cuárticas de la unidad son 
primitivas ¿ y —i, pero no 1 y —1. 


ye 


CAPITULO Y 
LOS POLINOMIOS Y SUS RAICES 


$ 20. Operaciones con los polinomios 


La teoría de los determinantes y la teoría de los sistemas de 
ecuaciones lineales es un desarrollo directo de la rama del álgebra 
escolar que, comenzando por una ecuaci n de primer grado con 
una incógnita, nos lleva a los sistemas de dos y tres ecuaciones de 
primer grado con dos y tres incógnitas, respectivamente. Otra rama 
del álgebra elemental, considerada más importante, consiste en el 
paso de una ecuación de primer grado con una incógnita a una ecua- 
ción cuadrática arbitraria, de nuevo con una incógnita, y después 
a unos tipos particulares de ecuaciones de tercero y cuarto grado. 
Esta rama se desarrolla en una amplia y rica sección del álgebra 
superior dedicada al estudio de ecuaciones arbitrarias de n-ésimo 
grado con una incógnita. Esta sección del álgebra esla más antigua, 
El presente capítulo, así como algunos de los capítulos ulteriores 
del libro están relacionados con esta sección. 

La forma general de una ecuación de n-ésimo grado (donde n es 
cierto número entero positivo) es 

ara lit... +0p- 3 + 4n=0. (1) 
Se supondrá que los coeficientes do, ay, ..., An-t, An SON números 
complejos arbitrarios y que el coeficiente superior ay es diferente 
de cero. 

Resolver la ecuación (1) significa hallar para la incógnita zx 
unos valores numéricos que satisfagan a esta ecuación, es decir, que 
al sustituirlos en lugar de la incógnita, después de realizar todas 
las operaciones indicadas, reduzcan a cero el primer miembro de 
la ecuación (1). 

Por otra parte, resulta conveniente sustituir el problema de la 
resolución de la ecuación (1) por el problema más general del estu- 
dio del primer miembro de esta ecuación 


arar... + an-s H ans, (2 


denominado polinomio de grado n en la indeterminada x. Hay que 
toner presente que ahora denominamos polinomio a una expresión 
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de la forma (2), o sea, a una suma de potencias no negativas de la 
indeterminada z, tomadas con ciertos coeficientes numéricos, y no 
a cualquier suma de monomios como ocurría en el álgebra elemen- 
tal. En particular, no se denominarán polinomios las expresiones 
que contengan la indeterminada z con exponentes negativos o frac- 


cionarios, por ejemplo, 22-43, o art + br? + crt -+ d -+ 
i 


+ ez -+ fa%, o bien, zž +1. Abreviadamente, los polinomios se 
designarán con las notaciones: f (2), g (z), y (2), etc. 

Dos polinomios f (z) y g (z) se supondrán iguales (o idénticamente 
iguales), f (z) = g (z), si son idénticos los coeficientes de potencias 
iguales de la indeterminada. En particular, un polinomio no puede 
ser idéntico a cero, si al menos uno de sus coeficientes es diferente 
de cero y, por lo tanto, el signo de igualdad que figura en la expre- 
sión de la ecuación de n-ésimo grado (1) no tiene que ver nada con 
la igualdad de los polinomios que acabamos de definir. El signo = 
que liga a los polinomios se debe entender como una identidad 
de los mismos. 

Por consiguiente, el polinomio de n-ésimo grado (2) se debe 
interpretar como una expresión formal, completamente determinada 
por el conjunto de sus coeficientes ao, a4, ..., an, donde ao +0. 
El significado exacto de estas palabras se aclarará mucho más tarde, 
en el cap. 10. Obsérvese que además de la expresión" del polinomio 
en la forma (2), o sea, según las potencias decrecientes dela indeter- 
minada z, se permitirán también otras expresiones obtenidas de (2) 
permutando los sumandos, como por ejemplo, la expresión según 
las potencias crecientes de la indeterminada. 

Naturalmente, se podría interpretar el polinomio (2) desde el 
punto de vista del análisis matemático, o sea, como una” función 
compleja de la variable compleja z. Sin embargo, se debe" tener en 
cuenta que dos funciones se suponen iguales cuando son" iguales sus 
valores para cualesquiera valores de la variable z. Está claro que 
dos polinomios que son iguales en el sentido algebraico formal 
indicado anteriormente, serán también iguales como funciones de x. 
Lo recíproco se demostrará en el $ 24. Después de esto resultarán 
equivalentes los puntos de vista algebraico y teórico—funcional sobre 
el concepto de polinomio con coeficientes numé icos; por ahora ten- 
dremos que indicar cada vez el sentido que se da al concepto de 
polinomio. En el párrafo presente y en los dos que siguen se consi- 
derará el polinomio como una expresión algebraica formal. 

Por supuesto, para cualquier número natural n existen polino- 
mios de n grado. Examinando todos los polinomios posibles, ademá: 
de los polinomios de primer grado, cuadráticos, cúbicos y etc., 
nos encontraremos con polinomios de grado cero, es decir, con núme- 
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ros complejos diferentes de cero. El número cero también se tomará 
como polinomio; éste es el único polinomio cuyo grado es 
indefinido. 

A continuación definiremos las operaciones de adición y mul- 
tiplicación para los polinomios de coeficientes complejos. Estas 
operaciones se introducirán del mismo modo que las operaciones 
con los polinomios de coeficientes reales, conocidas por el lector 
en el curso¿de álgebra elemental, 

Dados los polinomios f (z) y g (z) de coeficientes complejos, 
expresados para mayor comodidad según las potencias crecientes de z: 


f(a) =at att e apa 4 ana”, an0, 
E0=b+ba+- Fonda, b0, 
donde n>s, se llamará suma al polinomio 


MOET IOLE a E +. haa id ena”, 


cuyos cooficientes se obtienen sumando los coeficientes respectivos 
de iguales potencias de la indeterminada en las expresiones de 
f(z) y g(0), o sea, 
c=01+b, 1=0,4,....8, 3 
donde, para n > s, se tiene que suponer que los coeficientes ba+1, 
bstn ba son iguales a cero. El grado de la suma será igual a n, 
si n es mayor que s; pero, para n = s, puede ocurrir que éste sea 
menor que n, precisamente cuando bn = —An. 
Se llama producto de los polinomios f (z) y g (z) al polinomio 


Hg (a) Edot dit Hna, 
cuyos coeficientes se determinan del modo siguiente: 


d= Y ab, i=0,1,... 048s—1, n4s, (4) 
riai 


o sea, el coeficiente d; es el resultado de sumar todos los productos 
de aquellos coeficientes de los polinomios f (2) y g (z) la suma de 
cuyos índices es igual a i; en particular, dọ = aobo, dı = aob 

+ abo, «.:y dn+s = Andy. Dela última igualdad resulta la desigual- 
dad d+4,0. Por consiguiente, el grado del, producto de dos 
polinomios es igual a la suma de sus grados. 

De aquí se deduce que nunca será igual a cero el producto de 
polinomios, diferentes de cero. 

Para los polinomios, ¿qué propiedades poseen las operaciones 
introducidas? Las propiedades conmutativa y asociativa de la suma 
son consecuencia inmediata del cumplimiento de estas propiedades 
para la suma de los números, puesto que se suman los coeficientes 
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de cada potencia de la indeterminada por separado. La resta resulta 
posible: desempeña el papel del cero el número cero, que fue in- 
cluido como polinomio; el opuesto al polinomio f (x), escrito anterior- 
mente, es el polinomio 


—(a)= arm +. — Ap mapa”, 


La propiedad conmutativa de la multiplicación es consecuencia 
del cumplimiento de la propiedad conmutativa para el producto 
de los números y de que en la definición del producto de polino- 
mios, los coeficientes de ambos factores f (z) y g (x) se empleen 
de un modo equivalente. La propiedad asociativa se demuestra 
del modo siguiente: si, además de los polinomios f (z) y g (2) escri- 
tos anteriormente, es dado también el polinomio 


atte, 0, 


h(a =cotet+ 


el coeficiente de z', i=0, 1, ...,n+s4£ en el producto [f (2) X 
X g (x)| h (z) será el número 


> Y at)m= Y arb 
Z 2 kI) Cm = UIC ma 
¿AA a, 


mientras que en el producto f (x) [g (2) A (2)], será el número 
= Y arbem. 
held 


que es igual a él, 
Finalmento, el cumplimiento de la ley distributiva se deduce 
de la igualdad 


y S A 
(mtb) D ari Y bren 
mi rifat aTa 


puesta que el primer miembro de ésta es el coeficiente de zf en el 
polinomio [f (z) + g (2) 1% (2) y el segundo miembro es el coeficien- 
te de la misma potencia de la indeterminada en el polinomio 
Í e i (2) -g (2) h (2). 

bsérvese que en el producto de los polinomios, el número 1, 
clado como polinomio de grado cero, desempeña el papel 
de la unidad. Por otra parte, el polinomio f (1) posee un polinomio 


recíproco {° (2), 

f(a) f (=1 (5) 
cuando, y sólo cuando, f(x) es un polinomio de grado cero. En efecto, 
si f (2) es un número a, diferente de cero, el polinomio recíproco es 
el número a”. Pero si f (z) es de grado » > 1, el grado del primer 
miembro de la igualdad (5), en caso de que existiese el polinomio 
f` (2) no sería menor de n, mientras que en el segundo miembro 
figura un polinomio de grado cero. 
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De aquí se deduce que para el producto de polinomios no existe 
la operación inversa, la división. En este sentido, el sistema de todos 
los polinomios de coeficientes complejos se parece al sistema de todos 
los números enteros. Esta analogía se manifiesta en que para los 
polinomios, al igual que para los números enteros, subsiste el algo- 
ritmo de la división con resto*. Para el caso de los polinomios de 
coeficientes reales el lector ya conoce este algoritmo por el álgebra 
elemental. Pero, como consideramos ahora el caso de polinomios con 
coeficientes complejos, tendremos que hacer todos los enunciados 
due aquí se requieren y las demostraciones correspondientes. 

Para cualesquiera dos polinomios f (x) y g (z) se pueden hallar 
unos polinomios q (x) y r (z), de tal manera que 


$ (=) =g (2)4 (2) +r (0), (6) 

donde el grado de r (x) es menor que el de g (z), o bien, r (z) = 0. 

Los polinomios q (z) y r (x) que satisfacen a esta condición se deter- 
minan univocamente. 

Demostremos primero la segunda parte del teorema. Supongamos 

que existen también unos polinomios q (x) y r (z) que satisfacen 


a la condición 


16) =g (40) +F (8), (mM 


donde el grado de 7 (z) es de nuevo menor que ol deg (2)**. Igualando 
entre sí los segundos miembros de las igualdades (6) y (7). se tiene: 


g (2) lg ()—3 (2) = +) —r(a). 
El grado del segundo miembro de esta igualdad es menor que el de 
g (z), mientras que si q (2)—q (z) + 0, el grado del primer miembro 
Sería mayor o igual al grado de g (z). Por esto, tiene que ser q (z) — 
— q (z) = 0, o sea, q (z) = q (2), de donde r (z) = F (2), como se 
quería demostrar, 

Pasemos a demostrar la primera parte del teorema. Supongamos 
que n y s son los grados respectivos de los polinomios. Si n < s, 
se puede suponer que q (2) =0, r (z) = f ( z). Si n> s, aplica: 
remos el mismo método empleado en álgebra elemental para efec- 
tuar la división de polinomios.con coeficientes reales, ordenados 
según las potencias decrecientes de la indeterminada, Sea 

f(z) =a" 4 at nn anatta 090, 
g(a) =b tbi... bo ba b0. 
Poníendo 


(OA = fila), ® 


* Denominada también divi 
»» O bien F (2)=0. En adelan 


n entera (N del 7.). 
este caso no se va a excluir 
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se obtiene un polinomio cuyo grado es menor que n. Designemos 
este grado por nı, y el coeficiente superior del polinomio f (2), 
por asp. Si todavía n; > s, ponemos 


pl) pemg) = hle), (8) 


designamos con nz el grado y con azo, el coeficiente superior del 
polinomio fz (z), poniendo después 


Ote (a = 1 (a), (82 
y etc. 

Como los grados de los polinomios f; (z), fa (2), ... decrecen, 
n>n, > n: > ..., después de repetir este proceso un número finito 
de veces, obtendremos un polinomio fa (z): 

hal) =i ag (2) = fa (2), (8r-1) 


cuyo grado n, será menor que s, terminando así el proceso. Sumando 
ahora las igualdades (8), (Sp), ..., (811), se obtiene: 


10 (Lar e am a g (2) = fa (2), 


o sea, que los polinomios 


0, 


a(z) 
r (2) = fa (2) 


satisfacen verdaderamente a la igualdad (6), siendo realmente el 
grado de r (x) menor que el de g (2). 

Obsérvese que el polinomio q (z) se llama cociente de la di 
de f (2) por g (x) y r (z), resto (o residuo) de esta división. 

Do la consideración del algoritmo de la división con resto, se 
establece fácilmente que si f (x) y g (z) son polinomios de coeficien- 
tes reales, los coeficientes de todos los polinomios f, (x), fa (2), 
«+, Y, por consiguiente, también los del cociente q (2) y los del resto, 
r (z), son reales. 
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Sean dados unos polinomios f (z) y q (z), diferentes de cero, con 
coeficientes complejos. Si el resto de la división de f (z) por y (2) 
es igual a cero, o como también se dice, si f(x) se divide (o es divisi- 
ble) por q (z), entonces el polinomio y (z) se llama divisor del poli- 
nomio f (z). 
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El polinomio ¢ (z) es divisor del polinomio f (z) si, y sólo si, 
existe un polinomio y (2) que satisfaga a la igualdad 

i) =g (2) 4 (2). (1) 

En efecto, si ọ (z) es divisor de f (z), el cociente de la división 

de f (x) por q (z) desempeña el papel de y (z). Recíprocamente, 

supongamos que existe un polinomio y) (z) que satisface a la igual- 

dad (1). De la unicidad de los polinomios g (z) y r (x) que satis- 


facen a la igualdad 
(2) = (2)q (2) +r (2). 


demostrada en el párrafo anterior, y de la condición de que el grado 
de r (z) es menor que el de y (z), se deduce que en este caso el cocien- 
te de la división de f (z) por y (z) es igual a y (z) y el resto es 
igual a cero. 

Se comprende que, cumpliéndose la igualdad (1), y (z) es tam- 
bión divisor de f (z). Luego, es evidente que el grado de q (2) no 
es superior al de f (2). 

Obsérvese que, si el polinomio f (z) y su divisor q (z) tienen 
ambos coeficientes racionales o reales, el polinomio y (x) también 
tiene los coeficientes racionales o, respectivamente, reales, puesto 
que éste se halla mediante el algoritmo de la división. Por supues- 
to, un polinomio de coeficientes racionales o reales puede poseer 
también divisores cuyos coeficientes no sean todos racionales 
o, respectivamente, reales. Esto se observa, por ejemplo, en la 
igualdad 


2441=(2—i) (24 i). 

Señalemos algunas propiedades fundamentales de la divisibilidad 

delos polinomios que tendrán numerosas aplicaciones a continuación, 
vi f (a) es divisible por g (2) y g (z) es divisible por h (z), 

entonces j (2) es divisible por h (z). 

En efecto, por la condición f(x) = g (2) 9 o ye (a) = 
= h (2) y (z), y, por lo tanto, f (2) = h (z) ly (2) y (2) 

IL. Si f (2) y g (2) es divisible por q (x), su suma h ` diferencia 
también es divisible por y (z). 

En efecto, de las igualdades f(z) =p (z) (2) y g()= 

= q (2) y (2) resulta: f (2) + g (z) = y (2) ly (2) + x (0)1. 

TIL. Si f (2) es divisible por y (2), el producto de f (x) por cual- 
quier po inomio g (x) también es divisible por y (z). 

En efecto, si f(z) = ọ (z) (z), se tiene: f (2) g (2) = 
= q (2) ly (2) g (z)). 

De II y III se deduce la siguiente propiedad: 

IV. Si cada uno de los polinomios f, (2), fa (2), ..., fa (x) es divi- 
sible por q (z), el polinomio 


Fa (2) 81 (2) + fa (2) g2 (2) + - - - + fa (2) gr (2), 
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donde g, (2), 82 (2), ... ga (2) son unos polinomios arbitrarios, tam- 
bién es divisible por q (z). 

V. Todo polinomio To es divisible por cualquier polinomio de 
grado cero. 

En efecto, si (z) = aoz" + aya A +... an, y C es un número 
arbitrario, diferente de cero, o sea, un polinomio arbitrario de 
grado cero, entonces 

(9 (Lay Lam. 2) 

VI. Si f (z) es divisible por y (z), f (x) es también divisible por 
co (z), donde c es un número arbitrario, diferente de cero. 

En efecto, de la igualdad f (z) = q (2) y (2) resulta la igualdad 
$ (=) = leg (2)1-lco* y (2)). 

VII. Los polinomios cf (z), c +0, y sólo éstos, son los divisores 
del polinomio f (z) que tienen el mismo grado que f (x). 

En efecto, f (2) = ctlef (2)), o ea, f (2) es divisible p cf (a). 

Si, por otra parte, f (z) es divisible por q (z), coincidiendo los 
grados de f (2) y q (z), el grado del cociente de la división de / (2) 
por «p (x) tiene que ser igual a cero, es decir, f (z) = dọ (2), d + 0, 
de donde q (z) = d™ } (2). 

De aquí resulta la siguiente propiedad : 

VIII. Los polinomios f (z) y g (z) son divisibles entre sí cuando, 
y sólo cuando, g (z) = cf (2), c 0. 
almente, de VIII y 1 resulta la propiedad: 

IX. Todo divisor de uno de los dos polinomios f (x) y cf (2), donde 
c0, es divisor del otro 

Máximo común divisor. Sean dados unos polinomios arbitra- 
rios, f (æ) y g (z). El polinomio y (z) se llama divisor común de 
fyg ar si es divisor de cada uno de estos polinomios. La pro- 
piedad V (véase más arriba) muestra que todos los polinomios de 
grado cero pertenecen al conjunto de los divisores comunes de los 
polinomios f (z) y g (2). Si éstos no tienen más divisores comunes, 
se dice que son primos entre si. 

En el caso general, los polinomios f (2) y g (z) pueden poseer 
divisores dependientes de z. Introduzcamos ahora el concepto de 
máximo común divisor de estos polinomios. 

Sería incómodo tomar tal definición, según la cual el máximo 


Í (2) y g (2) pueden 
Poseer o no muchos divisores communes dislintes de mayor grado, 
que no sólo se diferencien entre sí en un factor de grado cero, por 
lo que esta definición resultaría muy indeterminada. Por otra parte, 
el lector ya conocerá por la aritmética elemental Ja forma de obtener 
el máximo común divisor de números enteros, y sabrá que el máxi- 
mo común divisor 6 de los números enteros 12 y 18, no sólo es el 
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mayor de los divisores comunes de estos números, sino que también 
es aasre por cualquier otro de sus divisores comunes; en efecto, 
los demás divisores comunes de los números 12 y 18 son: 1, 2, 3, 
—3, —6. 

Por consiguiente, para el caso de los polinomios, aceptare- 
mos la siguiente definici 

Se llama máximo común divisor de los polinomios f (z) y g (2), 
diferentes de cero, al polinomio d (z) que es común divisor y que 
a la vez es divisible por cualquier otro divisor común de estos poli- 
nomios. El máximo común divisor de los polinomios f (2) y g (z) 
se designa con la notación (f (z), g (2). 

Con esta definición no se aclara el problema de la existencia del 
máximo común divisor para cualesquiera polinomios f (2) y g (2). 
Ahora se dará una respuesta positiva a este problema. A la vez, 
se señalará un método para hallar el máximo común divisor de los 
polinomios dados. Por supuesto, aquí no se puede emplear el método 
con el que ordinariamente se halla el máximo común divisor de los 
números enteros, puesto que para los polinomios no tenemos por 
ahora nada parecido a la descomposición del número entero en un 
producto de factores primos. Sin embargo, para los números enteros 
eiste también otro método, denominado algoritmo de las divisiones 
sucesivas o algoritmo de Euclides; este método también puede apli- 
carse a los polinomios. 

El algoritmo de Euclides para Jos polinomios consiste en lo 
siguiente. Sean dados los polinomios f (z) y g (2). Se divido f (z) 
por g (z) y se obtiene por lo general un resto r; (z). Se divide luego 
g (z) por ri(x) y se obtiene el resto ra (z), se divide r, (2) por ra (2), 
etc. Como los grados de los restos van disminuyendo todo el tiem- 
po, en esta cadena de divisiones sucesivas llegaremos a un lugar 
en el que la división será exacta y el proceso se terminará. Æ? resto 
Ta (2), por el que se divide exactamente el resto anterior ra-4 (2), 
será el máximo común divisor de los polinomios f (x) y g (2). 

Para la demostración, escribamos lo expuesto en las líneas 
anteriores en forma de la siguiente cadena de igualdades: 


te =8 (2) qm (2) +71 (2), 
g (2) =r; (2) qa (z) + ra (2), 


rsi raah 2) 
Ta-a (2) que (2) +ra-i (2), 

Tras (2) ga (2) + ra (2), 

Pros (2) = ra (2) gasa (2). 


La última igualdad muestra que ra (z) es divisor de ra-, (2). 
De aquí resulta que ambos sumandos del segundo miembro de la 
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penúltima igualdad son divisibles por r, (z), y porlo tanto, ra (2) 
también es divisor de rą—+ (z). A continuación, subiendo del mismo 
modo a los otros renglones, obtenemos que ra (z) también es divisor 
de Tia (2), ..., Ta (2), ri (2). De aquí, en virtud de la segunda 
igualdad, resulta que rą (z) es divisor de g (z), de donde, en vir- 
tud de la primera igualdad, también es divisor de f (z). Por lo tanto, 
Ta (2) es un divisor común de f (z) y g (2). 

Consideremos ahora un divisor común arbitrario q (x) de los polino- 
mios f (z) y g (x). Como el primer miembro y el primer sumando del 
segundo miembro de la primera de las igualdades (2) son divisibles por 
9 (z), r, (z) también es divisible por q (z). Pasando a la segunda 
y a las siguientes igualdades, obtenemos del mismo modo que todos 
los polinomios rz (2), ra(z), ..., son divisibles por q (z). Si, final- 
mente, se ha demostrado que rj-2 (z) y Y-s (z) son divisibles por 
4 (z), de la penúltima igualdad obtenemos que ra (x) es divisible 
por «y (z). Por lo tanto, ra (z) es verdaderamente el máximo común 
divisor de f (z) y g (z). 

Por consiguiente, hemos demostrado que dos polinomios cuales- 
quiera poseen máximo común divisor y hemos obtenido un método 
para su cálculo. Este método muestra que, si los polinomios f (£) 
y g (z) tienen ambos coeficientes racionales o reales, los coeficien- 
tes de su máximo común divis r también son racionales o, respect 
vamente, reales, a pesar de que estos polinomios pueden tener 
divisores cuyos coeficientes no sean todos racionales (reales). Así, 
pues, los polinomios con coeficientes racionales 


tienen un máximo común divisor 2? — 2 con coefici raciona- 
les, a pesar de que tienen un común divisor x — Z cuyos coefi- 
cientes no son todos racionales. 

Si d (z) es el máximo común divisor de los polinomios f (a) 
y £ (z), como muestran las propiedades VIII y IX (véase la pág. 139), 
por máximo común divisor se podría tomar también el polinomio 
ed (x), donde c es un número arbitrario, diferente de cero. En otras 
palabras, el máximo común divisor de dos polinomios se determina 
salvo un factor de grado cero. En virtud de esto, se puede convenir en 
que el coeficiente superior del máximo común divisor de dos poli- 
nomios sea siempre igual a la unidad. Aplicando esta condición, se 
puede afirmar que dos polinomios son primos entre si cuando, y sólo 
cuando, su máximo común divisor es igual a la unidad. En efecto, 
por máximo común divisor de dos polinomios, primos entre sí, se 
puede tomar cualquier número diferente de cero; pero si este 


número se multiplica por su elemento recíproco, obtenemos la 
unidad. 
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Ejemplo. Hallar el máximo común divisor de los polinomios 
12) =14 43103124473, g(2) 31341012422 —3. 


Para evitar coeficientes fraccionarios, al aplicar el algoritmo do Euclides 
a los polinomios con coeficientes enteros, se puedo multiplicar el dividendo 
o simplificar el divisor por cualquier número diferente de cero, no sólo al comen- 
za ma de las divisiones sucesivas, sino también durante el proceso de la 
división misma. Naturalmente, esto conducirá a una alteración del cociente, 
piero dos restos que nos interesan adquirirán solamente, un factor de grado coro, 
lo que, como ya sabemos, al buscar el máximo común divisor, es admisible. 

Dividimos / (z) por g (z), multiplicando proviamente / (z) por 3: 


Brt 93 — 3r? —12r—9 [3131 10124223 
34/1073 z+1 
=4=3A=0 3 


(multiplicamos por —3) 


Por lo tanto, después do simplificar por 5, el primer resto es r; (z) = 
a2-| 5z -6. Dividimos el polinomio g (z) por éste; 

373/1072 tsr 
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plificar por 9, el segundo resto es: 


Por consiguiente, después de si 
ra(s)=<-+3. Como 


ri (0) =r0 (0) (242) 
ra (x) serú el último resto, por el que se divido exactamente ol resto anto- 
ríor. Por lo tanto, óste es el máximo común divisor: 


O) g E= r+. 


Apliquemos el algoritmo de Euclides para la demostración del 


teorema siguiente: 
Si d (a) es el máximo común divisor de los polinomios f (2) y g (2), 


existen tales polinomios u (x) y v (x) que 
tiz) ula) +g (2) v (2) =4 (2). (3) 
Siempre se puede suponer que, si los grados de los polinomios f (2) 
y g (z) son mayores que cero, el grado de u (x) es menor que el grado 
de g (2) y el grado de v (z) es menor que el grado de f (2). 
La demostración está basada en las igualdades (2). Si se tiene 
en cuenta que ra (z) = d (z) y se pone u, (z) = 1, v, (4) = —qa (2), 
según la penúltima de las igualdades (2), se tiene: 
d (2) = ra-a (2) us (2) + ra- (2) vs (2). 


$ 21. Divisores. Máximo común divisor 143 


Ponienda aquí la expresión de ra- (2) mediante ra-a(2) y Ta-2 (2), 
se obtiene de la igualdad anterior (2): 

A (2) = rr- (2) Us (2) +Ta-2 (2) va (2), 
donde, evidentemente, ta (2) = v, (z), va (9) u (2) 012) qa (a) 
Continuando el ascenso por las igualdades (2), se llegará, tinal- 
mente, a la igualdad (3) que se quería demostrar, 

Para la demostración de la segunda afirmación del teorema, 
supongamos que se han hallado ya los polinomios u (z) y v (2) 
que satisfacen a la gualdad (3), pero que el grado de u (z) es, por 
ejemplo, mayor o igual al grado de g (2). Dividamos u (z) por g (2): 


u (z) = g (2)q (z) +r (2), 


donde el grado de r (z) es menor que el grado de g (z), e introduz- 
camos esta expresión en (3). Se obtiene la igualdad. 


FD) r (a) + g (a) ba + f Nale) = d (2). 


El grado del factor que figura con f (z) es ya menor que el grado 
de g (z2). Por otra parte, el grado del polinomio que figura entre 
corchetes es menor que el grado de f (z), puesto que, en caso con- 
trario, el grado del segundo sumando del primer miembro no sería 
menor que el grado del producto g (z) f (x), y como el grado del 
primer sumando es menor que el grado de este producto, todo el 
primer miembro sería de grado mayor o igual a g (2) f (z), mientras 
que según nuestra suposición, el polinomio d (z) es de menor grado. 

Así el teorema queda demostrado. A la vez, tenemos quo, si los 
polinomios f (z) y g (z) tienen coeficientes racionales o reales, los 
polinomios u (z) y v (z) que satisfacen a la igualdad (3) se pueden 
elegir de modo que sus coeficientes sean racionales o, respectiva- 
mente, reales, 


ana Hgo» Hallomos los polinomios u (z) y v (z) que satisfacen a la igual- 
ad (3), si 

A 1()=23—2%-1 3210, g(2)=28-46:?—9:—14. 

Apliquemos el algoritmo de Euclides a estos polinomios: ahora, al efectuar 
Jas divisiones ya no se puede permitir ninguna alteración do los cocientes, puesto 
que éstos se emplean para hallar los polinomios u (z) y v (z). Obtenemos el 
siguiente sistema do igualdades: 


J)e (E) TA Le 


(ora o (e) i p EA 
—1 41274 4=(2—2) (712). 


De aquí salo que (f(z), g(2)= 
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Aplicando ahora el teorema demostrado a polinomios, primos 
entre sí, obtenemos el siguiente resultado: 

Los polinomios f (z) y g (z) son primos entre sí cuando, y sólo 
cuando, existen unos polinomios u (x) y v (z) que satisfacen a la 


igualdad 
Hou (a +g (0). (7) 0] 


Basándose en este resultado se pueden demostrar unos cuantos 
teoremas sobre los polinomios primos cutre sí, que, aunque sen- 
cillos, son importantes: 

a) Si el polinomio f (x) es primo con cada uno de los polinomios 
« (2) y Y (z), también es primo con su producto 

En efecto, según T(4), existen unos polinomios u (z) y v(e) 


sales que 
į (£) u (x) + (z) (2) = t 
Multiplicando esta igualdad por (z), obtenemos: 
160) (u (2) Y Al A A (a, 

do donde se deduce que todo común divisor de f (2) y y (z) y (2) es 
también divisor de Y (z); sin embargo, según la condición, (f (2), 
Ya) = 1 

b) Si el producto de los polinomios f (2) y g (z) es divisible por 


g (2), pero f (2) y y (x) son primos entre sí, g (2) es divisible por y (2). 
En efecto, multiplicando la igualdad 


1020700 (1) =1 


4, 


por g(x), obtenemos: 
VO g (2)) u (2) +4 (2) lo (0) g (0)1=8 (0). 
Ambos sumandos del primer miembro de esta igualdad son divisibles 


por ọ (z); por consiguiente, también g (z) es divisible por qa). 
c) Si el polinomio f (z) es di i 


ble por cada uno de los polinomios 
9 (2) y y (2), que son primos entre sí, entonces f (z) también es divi- 
sible por su producto. E 

En electo, f (z) = q (2) q (2), o sea, el producto que figura en 
el segundo miembro es divisible por y (z). Por esto, según b), 9 (z) 
es divisible por (z), 9()=Y(0 p (1), de donde f(z) = 
= lp (0) y (MY. P i 

La definición de máximo común divisor se puede generalizar 
al caso de cualquier sistema finito de polinomios. Se llama máximo 
común divisor de los polinomios f; (2), f2 (2), -.., fe (2) a su divisor 
común que es divisible por cualquier otro divisor común de los 
mismos. La existencia del máximo común divisor para cualquier 
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sistema finito de polinomios es consecuencia del siguiente teorema, 
que facilita también un procedimiento para su cálculo. 

El máximo común divisor de los polinomios f; (2), fa (4), --., 
fs (2) es igual al máximo común divisor del polinomio fs (x) y del 
máximo común divisor de los polinomios fy (2), fo (a), +1 fas (2). 

En efecto, el teorema es evidente para s —2. Por esto, supon- 
dremos que el teorema subsiste para el caso s— 1, o sea, que, en 
particular, ya está demostrada la existencia del máximo común 
divisor d (2) de los polinomios fa (2), Je (2), -.., fa-1 (2). Designemos 
mediante d (z) el máximo común divisor de los polinomios d (z) 
y fs (2). Es evidente que éste es un divisor común de todos los poli- 
nomios dados. Por otra parte, cualquier otro divisor común de estos 
polinomios es también divisor de d (z) y, por lo tanto, de d (z). 

En particular, so dice que f; (2), fe (2), ..., fs (2) es un sistema 
de polinomios, primos entre sí, si los únicos divisores comunes de 
ellos son los polinomios de grado cero, o sea, si su máximo común 
divisor es igual a 1. Si s > 2, puede ocurrir que estos polinomios 
no sean primos entre sí dos a dos. Así, pues, los polinomios 

f) =T 472415, g()=0—2—20, 
h(a) = 144122 
son primos entre sí, a pesar de que 


U(x), g(2))= » (f (2), h (2)) n O, A) A 


El lector obtendrá fácilmente la generalización de los teoremas 
a) — €), demostrados anteriormente, sobre los polinomios primos 
entre sí, para el caso de cualquier número finito de polinomios 
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En el $ 20 nos encontran 


con los valores de un polinomio, 


cuando se hablaba del punto de vista teórico-funcional del concepto 


de polinomio. Recordemos la de 
Si 


n. 


Í(2) =at" La, (1) 


es un polinomio y c es un número, el número 

He) = aoc" Gao... 
obtenido por la sustitución de la indeterminada z por el número c, 
en Ja expresión (1) de f (2), y por la realización consiguiente de las 
operaciones indicadas, se denomina valor del polinomio f (x) para 
x- e. Se comprende que, si f (2)= g (2), en el sentido de la igual- 
dad algebraica de polinomios definida en el $ 20, entonces 
1 (c)-g(c) para cualquier c. 


10—252 


146 Cap. V. Los polinomios y sus raices 


ácilmente se ve también que si 


0-1 æ), va (mem. 
a (e) fte) + 8(0), vc) =F (0) elo). 


En otras palabras, considerando a los polinomios desde el punto de 
vista teórico-funcional, la suma y el producto de los polinomios 
definidas en el $ 20, se convierten en la suma y el producto de fun- 
ciones, consideradas en el sentido de la suma y producto de los valo- 
res respectivos de estas funciones. 

Si f()- 0, o sea, si el polinomio f(z) se anula al 
susti tuir el número c en lugar de la indeterminada, e se lama raiz 
del polinomio f (2)* (o de la ecuación f (z) = 0). Ahora se demostr 
rá que este concepto está relacionado con la teoría de la divisibi 
dad de los polinomios, estudiada en el párrafo anterior. 

Si se divide el polinomio f (z) por un polinomio arbitrario de 
primer grado (o como se dirá a continuación, por un polinomio lineal), 
el resto será un polinomio de grado cero o bien será igual a cero, es de- 
cir, siempre será un número r. Aplicando el teorema que sigue es fác 
hallar este resto sin realizar la división (se supone que el polinomio 
lineal es de la forma z— c). 

El resto de la división de un polinomio f (x) por un polinomio 
lineal x — e es igual al valor f (c) que toma el polinomio f (x) para 
rc, 

En efecto, sea 


se tiene 


10) =(—=0) q (0) +1 r. 


Tomando los valores de ambos miembros de 
x=e, obtenemos: 


ta igualdad para 


Fc) =(c=c)q tc) r-r 


lo cual demuestra el teorema. 

De aquí se deduce la importante conclusión: 

El número c es raíz del polinomio f (x) cuando, y sólo cuando, 
f (2) es divisible por z — c. 

Por otra parte, es evidente que si f (z) es divisible por algún poli- 
nomio de primer grado az -|- b, es divisible también por el polino- 
mio z—( —Ž) , o sea, por un polinomio de la forma z—e. De este 
modo, la averiguación de las raíces del polinomio f (x) es equivalente 
a la averiguación de sus divisores lineales. 

En virtud de lo expuesto anteriormente, el siguiente método 
de división de un polinomio f (x) por el binomio lineal 2—c es de 
especial interés, pues es más simple que el algoritmo general de di- 


* También se dice que e es un cero del polinomio f (2). (Nota del'7.) 
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visión de los polinomios. Este método se denomina regla de Horner. 
Sea 
Jaa" aa a] oH an (2) 
y supongamos que 
160) =(le—0) 4 (0) +7, (3) 
donde 
pcia e 


Igualando en (3) los coefici 
nemos 


iguales de z, obte- 


De aqui se deduce que by = ao bn = cbn i ban k= 
24,2... n — f, o sea, se obtiene el coeficiente by multipli- 
cando el coeficiente anterior bs- ; por c y agregándole el coeficiente 
correspondiente aj; finalmente, Y =cb,-4 = An, es decir, el res- 
Lo r, que como ya sabemos es igual a f (c), se obliene por la misma 
regla. Por lo tanto, los coeficientes del cociente y el resto se pueden 
obtener sucesivamente mediante unos cálculos del mismo tipo; éstos 
se realizan de acuerdo a un esquema, como se muestra en los siguien- 
tes ejemplos: 


1. Dividic f (2) 225 


Formemos una tabla co ntes del polino- 
mio { (2); bajo la raya se eo orrespondientes del cociente 
y del resto que se ealeulan s izquierda, a un lado, el valor 


dado de e 


1 P 
100,3-109 


3 fa 5.3 
Por lo tanto, el coefic, 
qt 20 

y el resto, ro (3) 32 
Dividir f(r) zt- 8e È 


E 


3öz | 109, 


yel resto (7: /—1) 5 


10% 
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Estos ejemplos muestran que la regla de Horner se puede utili- 
zar también para calcular rápidamente el valor del polinomio para 
un valor dado de la indeterminada. 

Raíces múltiples. Si c es una raíz del polinomio f (z), o si 
si f (e) = 0, entonces, como ya sabemos f (2) es divisible por z — 
Puede ocurrir que f (2) no sólo sea divisible por la primera potencia 
del binomio lineal = —c, sino también por potencias superiores, 
De todos modos, siempre existirá un número natural k tal que f (2) 
sea divisible por (z — c)*, pero no por (z — c)'*%, En consecuencia, 


te= o"e (0, 


en donde el polinomio y (z) ya no es divisible por z — c, o sea, el 
número c no es raíz de p(z). El número k se llama orden de multipli- 
cidad do la raíz c del polinomio f (z) y el número c, raíz múltiple 
de esto polinomio de orden k. Si k = 1, se dice que c es una raíz 
simple. 

El concepto de raíz múltiple está estrechamente ligado con ol 
woncepto de derivada del polinomio. Como estamos estudiando 
los polinomios con coeficientes complejos cualesquiera, no podemos 
utilizar directamente el concepto de derivada que so introdujo en el 
«curso de análisis matemático. Todo lo que se diga a continuación 
se dobe considerar como una definición de la derivada de un poli- 
nomio, independiente del curso de análisis. 

Sea dado un polinomio de n-ósimo grado 


Fx) = aoz" + aya eee Hant + an 


A, 


con cualosquiera coeficientes complejos. El polinomio de (r — 1) — 
ésimo grado, 

Fl) may 4- (1—1) at... Zap Ho 
so lama) derivada! (o derivada primera) del polinomio f (2), La 
derivada de cero y de un polinomio de grado cero se supone igual 
a cero. La derivada de la derivada primera se llama derivada segunda 
del polinomio f (z) y se designa con f” (x), ete. Es evidente que 


[W()=n! do, 


por lo cual [%*P (2) = 0,' es decir, la (r + 1)-ésima derivada 
de un polinomio de n-ésimo grado es igual a cero. 

En el caso de polinomios de coeficientes complejos no podemos 
utilizar las propiedades de la derivada que fueron demostradas en el 
curso de análisis para los polinomios de coeficientes reales, sino 
que tenemos que demostrar de nuevo estas propiedades utilizando 
solamente la definición de derivada dada anteriormente. Aquí nos 
interesan las siguientes propiedades que, como se suele decir, re- 
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presentan las fórmulas del derivación de la suma y del producto: 


(H(z) +g Y =f (a) +g (a) 4) 
(U (2)-g (2) = f (2) g' (£) +f (2) g (2). (5) 


Estas fórmulas se comprueban fácilmente mediante un cálculo 
directo, tomando por f (z) y g (z) dos polinomios arbitrarios y apli- 
cando la definición de derivada dada anteriormente; recomendamos 
al lector hacerlo. 

La fórmula (5) se generaliza sin dificultad al caso de un producto 
de cualquier número finito de factores, de donde, de un modo ordi- 
nario, se puede deducir la fórmula para la derivada de una potencia: 

ON (6) 

Nuestro propósito es demostrar el teorema siguiento: 

Si el número c es una raíz k-múltiple del polinomio f (x), entonces, 
para k > 1, éste será una raíz (k — 1)-múltiple de la derivada pri- 
mera de este polinomio; si k = 1, el número c no será raíz de f' (2). 

En efecto, sea 


10) (20 (2), k>1, (7) 


donde q (z) ya no es divisible por z—c. Derivando la igualdad (7), 
se obtiene: 
== y (4209 (a) = 


(20 (20) 9 (2) + ko (2). 


El primer término de la suma que figura entre los 
sible por z — c, mientras que el segundo no es di 
por consiguiente, toda esta suma no puede ser div 
Teniendo en cuenta que el cociente de la divi 
(a — c)"-1 se determina unívocamente, resulta que (z — c)" 
es la máxima potencia del binomio z — e por la cual es divisible 
el polinomio f’ (z), como se quería demostrar. 

Aplicando unas cuantas veces este teorema, obtenemos que la 
raíz k-múltiple del polinomio f (x) es raiz (k — s)-múltiple de la 
s.ésima derivada de este polinomio (k>s) y que por primera vez 
no será raíz para la h-ésima derivada de f (2). 


rohetes es divi- 
ible por éste; 
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Al estudiar en el párrafo anterior las raíces de los polinomios, 
no planteamos el problema de la existencia de raíces para cual- 
quier polinomio. Se sabe que existen polinomios de coeficientes 
reales que no tienen raíces reales como, por ejemplo: 2? + 1. Se podría 
esperar que existiesen polinomios que no tuviesen raíces incluso 
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entre los números complejos, sobre todo si se consideran polin 
mios con cualesquiera coeficientes complejos. Si esto fuese así, 
se necesitaría una ampliación ulterior del sistema de los números 
complejos. Sin embargo, en realidad, subsiste el siguiente teorema 
fundamental del álgebra de los números complejo: 

Todo polinomio de cualesquiera coeficientes numéricos, cuyo grado 
no sea menor que la unidad, tiene por lo menos una raíz, general- 
mente, compleja. 

Este teorema es uno de los adelantos más grandiosos de toda la 
matemática y encuentra aplicación en las más diversas ramas de la 
ciencia. En particular, en él se basa toda la teoría ulterior de los 
polinomios con coeficientes numéricos. Por esta razón, le llamaban 
antes (y a veces ahora también le llaman) «teorema fundamental 
del álgebra superior». No obstante, el teorema fundamental no es 
puramente algebraico. Todas sus demostraciones (después de Gauss, 
que fue el primero en demostrar este teorema a fines del siglo XVIII, 
se hallaron muchas otras demostraciones), en tal o cual grado, emplean 
las llamadas propiedades topológicas de los números reales y com- 
plejos, o sea, las propiedades que están ligadas a la continuidad. 

En la demostración que se va a exponer ahora, el polinomio 
f (2) de coeficientes complejos se va a considerar como una función 
de la variable compleja z. Por lo tanto, z puede tomar cualesquiera 
valores complejos, o como suele decirse, teniendo en cuenta el método 
de construcción de los números complejos expuesto en el $ 17, la 
variable x varía en el plano complejo. Los valores de la función 
j (x) también serán números complejos. Se puede suponer que estos 
valores se señalan en otro ejemplar de plano complejo, del mismo 
modo que en el caso de las funciones reales de la variable real los 
valores de la variable independiente se señalan en una recta numérica 
(eje de abscisas), y los valores de la función, en otra (eje de orde- 
nadas). 

La definición de función continua que conoce el lector por el 
curso de análisis matemático, se generaliza también para la función 
de la variable compleja, donde en el enunciado de la definición 
se deben sustituir los valores absolutos por los módulos. 

Precisando, la función compleja f (z) de la variable compleja x 
se llama continua en el punto zo, si para cualquier número real posi- 
tivo e se puede elegir un número real positivo 6 tal que se cumpla la 
desigualdad 


+ )— i (20) <e 


para cualquier incremento h (por lo general, complejo) cuyo módulo 
satisfaga a la desigualdad |h |< ô. La función f (z) se llama con- 
tinua, si es continua en todos los puntos zo en que está definida la 
función. 
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Un polinomio f (x) representa una función continua de la variable 
compleja z. 

Se podría efectuar la demostración de este teorema del mismo 
modo que se hace en el curso de análisis malemático, o sea, demos- 
trando que la suma y el producto de funciones continuas también 
son continuas y observando que una función que constantemente 
es igual a un mismo número complejo, es continua. Sin embargo, 
aquí procederemos de otro modo. 

Demostraremos primero un caso particular del teorema: la con- 
linuidad de f (z) en el punto xo = 0, suponiendo que el término 
independiente del polinomio f (x) es igual a cero, En otras palabras, 
demostraremos el siguiente lema (en lugar de h se escribirá z) 

Lema 1. Si el término independiente del polinomio f (x) es igual 
a cero: 


Paaa n anaE, 
o sea, f(0) = 0, entonces para cualquier e >0Uexiste un número 
8> 0 tal, que |f (2) | < € para todos los x que satisfacena la con- 
dición |z |< ô. 
n efecto, sea 
A: máx (|a|, lasl, «++ |€u-1]). 
va dado el número e. Demostremos que el número 


` (1) 


ones que se piden. 


satisface a las condi 
En efecto, 


Pza [ei la] api 11000] lel 
Aez a +12), 

o sea, 

PPE PA 

AIE i e a 
Como |r| <6 y como, en virtud de (1), 8< 1, se tiene: 
por lo cual, 

ASIS e, 


como se quería demostrar. 
© Deduzcamos ahora la fórmula que sigue. Sea dado un polino- 
mio 
Iia” paai io... paitan 
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con cualesquiera coeficientes complejos. Sustituyamos z por la suma 
x+h, donde h esotra indeterminada. Desarrollandoen el primer miem- 
brocada una de las potencias (z-}-4)*, k<n, según la fórmula del bino- 
mio, yreuniendo todos los términos con iguales potencias de h, se obti- 
ene la igualdad 

12 


MA a TON 


que el lector fácilmente puede comprobar, o sea, la fórmula de 
Taylor, que proporciona el desarrollo de f (x -|- h) en potencias 
del «incremento» h. 

La continuidad de un polino: 
se demuestra ahora del modo 
de Taylor, 


Fwd) — f (20) = 0144 eh? -tnn 


arbitrario f (zx) en cualquier punto 2, 
guiente. En virtud de la fórmula 


mn H cnh” = (0), 
lond 


a= (o) te= Bo) 120. 


El polinomio ¢ (+) en la indeterminada + es un polinomio sin término 
independiente y, por esto, en virtud del lema 1, para cualquier e> 0 
existe un > O tal que | y (h) | < e, o sea, 


lf (to +1)—F(20)1<e, 


para h< ð, que es lo que se quería demostrar. 
De la desigualdad 


ILA (zoh) |— 14 (20) | 1< 1f (z0 H) — f (20) |, 


basada en la fórmula (13) del § 48, y de la continuidad de un poli- 
nomio, que acabamos de demostrar, se deduce la continuidad de 
módulo | (z) | del polinomio, Y (z); os evidente que oste módulo 
es una función real no negativa de la variable compleja z. 

Ahora se demostrarán unos lemas que se empleara en la demos- 
tración del teorema fundamental. 

Lema sobre el módulo del término superior. Dado un polinomio 
de n-ésimo grado, n> 1, 


f (5) = aor" + aa" -i age” 


+an 

de coeficientes complejos arbitrarios, si k es un número real 

positivo cualquiera, para los valores de la indeterminada x. 

cuyos módulos son suficientemente grandes, se verifica la desigualdad 
Laya" |> kart aja anh, (2) 

es decir, el módulo del término superior es mayor que el módulo de 


la suma de todos los demás términos, y además, una cantidad arbitraria 
de veces. 
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En efecto, sea A el máximo de los módulos de los coeficientes 


as, Azs y Api 


máx (laih [azl -s Jaa) 
Entonces 
(a"i al al lz laal e 0 
E A jn 


(véase en el $ 18 las propiedades de los módulos de la suma y el 
producto de números complejos). 
Suponiendo | |> 1, se obtiene: 


de donde 


ar aga 


ualdad (2) si z, además de satis- 


Por lo tanto, se cumplirá la des 
n a la desigualdad 


facer a la condición |z|>1, sa 


Ed 


f kA FE < laor” |= fao] [21% 
lzi> +1 (5 


Como el segundo miembro de la desigualdad (3) es mayor que 1, se 
puede afirmar que para los valores de x que satisfagan a esta desi- 
gualdad, se cumple la desigualdad (2), la cual demuestra el lema, 

Lema sobre el crecimiento del módulo de un polinomio. Para todo 
polinomio f (x) de coeficientes complejos, cuyo grado no sea menor 
que la unidad, y para cualquier número real positivo M arbitraria- 
mente grande, se puede elegir un número real positivo N tal, que 
|f) [> M para |x| 


Sea 
(0-0 an 
En virtud de la fórmula (11) del $ 48, 
14) Laja” © (a; +...+an)| 
[aye |— laz ianh (0) 


Apliquemos el lema sobre el módulo del término superior. Supo- 


niendo k= 2, existe un 
[aya 


para | 
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De aquí que 


la. laor" |, 
o sea, en virtud de (4), 
1/46) 1> laz" |— a] -Ajaz |. 


mayor que M para 


Por lo tanto, |/(2)|>M para |z| >N- m 
Se pu 
ilustración geomé 


(Ni Na). 


de aclarar el significado de este lema mediante la siguiente 


, que se empleará a menudo en este párrafo. 
Supongamos que por cada punto zo del 
plano complejo se traza una perpendi- 
cular a este plano de longitud (refe- 
rida a la unidad de medida elegida) 
igual al módulo del valor del polino- 


mio f (2) en este punto, o sea, igual 
a |/ (zo) |- En virtud del teorema de la 
~~~ continuidad del módulo de un polino- 


mio, demostrado anteriormente, los extre- 
Fig. 8. mos de estas perpendiculares formarán 
7 una superficie alabeada continua, situa- 
da sobre el plano complejo. El lema sobre el crecimiento del mó- 
dulo de un polinomio muestra que al aumentar |zy |, esta superficie 
se aleja más y más del plano complejo, aunque, naturalmente, este 
alejamiento no es monótono. La fig. 8 representa esquemáticamente 
la línea de intersección de esta superficie con un plano per- 
pendicular al plano complejo y pasa por el punto O. 
En la demostración, el papel fundamental lo desempeña el si- 
guiente lema: 
Lema de D'Alembert. Si para x = zo el polinomio f (x) de grado 
n, n > 1,no se anula, f (20) +0 y, por lo tanto, | f (x0)] >0, se 
puede hallar un incremento h, generalmente complejo, tal que 


lr +h] <] f (z0) l. 


Según la fórmula de Taylor, siendo por ahora arbitrario el 
incremento h, se tiene: 


Ilot h) = fleo) HA Bati A e Hg O o). 


Por la condición, zy no es raíz de / (z). Sin embargo, este número 
puede ser eventualmente, raíz de f’ (2), y también puede ocurrir que 


pon 
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sea raiz de ciertas derivadas posteriores. Supongamos que la k-ósima 
derivada (k > 1) es la primera que no tiene a zy por raíz, o sea, que 


Ë (z= f (10) =-.. =J00(29)=0, 10% (29) 40. 


Tal / existe, puesto que si ay es el coeficiente superior del polinomio 
Í (2), entonces 

{M (z) =n! ay 0. 
Por lo tanto 


Iei h= e) AN (2) + 
en EASO (20). 


ID o + 
J" (xo) también pueden 


Algunos de los números /*™ (ro), 

ser iguales a cero. Pero esto no importa 
Dividiendo ambos miembros de esta igualdad por f (xo), que por 

la condición es diferente de cero, e introduciendo la notación 


j9’ (ro) k k4 
ama kdd. 


se obtiene; 


A E 
o, puesto que #0, 
Leo A AE, 
LETO = (Li eah") i enh TE ) i 
Pasando a los módulos so obtiene: 
Hizo th) En pnk 5 
Teo aet © 


Hasta ahora no hemos hecho ninguna suposición sobre el inere- 
mento A. Ahora vamos a elegir h; s, elegiremos su módulo 
y su argumento por separado. El módulo de h se elegirá del modo 
šigniente. Como 


e 


en. pon 
aea rra 
hh. tE 


es un polinomio en» si 


término independiente, en virtud del 


lema 1 (suponiendo e=2), se puede hallar un ô; tal que 


(6) 


para [A] <ò; 
Por otra parte, 


Jeh" | <A, (7) 
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para A 

lh] < ô= Ver] 
Supongamos que el módulo de h se ha clegido de acuerdo a la 
desigualdad 


|] < mín (ô, 82). (8) 

Entonces, en virtud de (6), la desigualdad (5) se convierte en la 
desigualdad estricta 

(zo +h) 

rra 


un poco más adelante utilizaremos la condición (7). 
Para la elección del argumento de h, exigiremos que el número can 
sea real y negativo. En otras palabras, 


arg (cnh") = arg cr +k arg h = 


1 


+= lerh" |; (9) 


de donde 

argh = FE. (10) 
Con esta elección de h, el número ch! se diferenciará de su valor 
absoluto en el signo, 

cnh" = —| cah" |; 
por consiguiente, aplicando la desigualdad (7), 

11 erh" |=] 1 — | cnh" |= 1 — | exh" |, 
En consecuencia, eligiondo % de acuerdo a las condiciones (8) 

y (10), la desigualdad (9) toma la forma 


Liza dr Me gi 
YAA | <a lenh" |+- lenh" | =1— Lente], 
o sea, 
Lizoth) | _ L (oth 
Ts TT 


de donde resulta 
If (o th)| <] f (20) l, 


lo que demuestra el lema de D'Alembert. 

Mediante la ilustración geométrica que se dio anteriormente, 
se puede aclarar el lema de D'Alembert del modo siguiente. Supon- 
gamos que |f (zo) | > 0. Esto significa que la longitud de la per- 
pendicular al plano complejo, trazada por el punto zo, es diferente 
de cero. Entonces, según el lema de D'Alembert, se puede hallar 
un punto z, = xo + h tal que |f (2)|<|f (20) |, o sea, la per- 
pendicular en el punto z, será más corta que en el punto zo, y, por 
consiguiente, la superficie formada por los extremos de lás perpen- 
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«diculares estará en este punto nuevo un poco más cerca del plano 
complejo. Como se ve por la demostración del lema, el módulo de h 
se puede suponer lo más pequeño que se desee, o sea, el punto zs 
se puede elegir cuanto más cerca de zp se quiera; sin embargo, no 
aplicaremos a continuación esta observación. 

Es evidente que son raíces del polinomio f (x) los números 
complejos (o sea, los puntos del plano complejo) en los que la super- 
ficie formada por los extremos de las perpendiculares está en con- 
tacto con este plano. Basándose solamente en el Jema de D'Alembert 
no se puede demostrar la existencia de tales puntos. En efecto, apli- 
cando este lema se puede hallar una sucesión indefinida de puntos 
Zo, Bys Zo ee es Lal que 

edl SIESS. (11) 
Sin embargo, de aquí no se deduce la existencia de un punto z tal 
que f (2) = 0; pues una sucesión decreciente de números rea- 
les positivos (11) no tiende necesariamente a cero. 

El examen ulterior se basará en un teorema de la teoría de las 
funciones de la variable compleja que generaliza el teorema de Weiers- 
trass, conocido por el lector en el curso de análisis matemático, 
listo se refiere a las funciones reales de la variable compleja, es 
decir, a las funciones de la variable compleja que solamente toman 
valores reales; un ejemplo de tales funciones es el módulo de un 
polinomio. En el enunciado de este teorema, para simplificar, se 
hablará del círculo cerrado E, entendiendo por esto un círculo del 
plano complejo al que se le han añadido todos los puntos de su con- 
torno. 

. Si una función real g (x) de la variable compleja æ es continua 
en todos los puntos de un circulo cerrado E, en éste existe un punto Zo 
tal, que para todos los puntos x de E se verifica la desigualdad g (2) > 
> g (xo). Por consiguiente, el valor mínimo de g (x) en el círculo E 
se alcanza en el punto Zo. 

La demostración de este teorema se puede hallar en todos los 
cursos de teoría de las funciones de la variable compleja, por lo que 
aquí no se oxpondrá. 

Aclararemos geométricamente este teorema mediante la ilus- 
tración empleada anteriormente, l ndonos al ci en que la 
función g (z) sea no negativa en todos los puntos del círculo Æ (sola- 
mente este caso presenta interés). Tracemos por cada punto rọ del 
círculo Æ una perpendicular de longitud g (xp). Los extremos de 
as perpendiculares formarán un trozo de una superficie alabeada 
continua, y como el círculo E es cerrado, geométricamente está 
suficientemente claro que para esta superficie existe un mínimo, 
Naturalmente, esta istración no sustituye a la demostración del 
teorema. 
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Ahora podemos pasar a la demostración directa del teorema 
fundamental. Sea dado un polinomio f (x) de grado n, n > 1. Resulta 
evidente que si su término independiente es a,, se tiene: f (0) = ay. 
Apliquemos el lema sobre el crecimiento del módulo de un polinomio, 
suponiendo M = | f (0) | = |an |. Por consiguiente, existe un 
N tal que | f (2) | > | Ż (0) | para |x | >N. Se comprende que la gene 
ralización del teorema de Weierstrass indicada anteriormente es 
aplicable a la función |/(z)| para cualquier círculo cerrado Æ 
elegido. Tomemos por Æ el circulo cerrado, limitado por la circun- 
ferencia de radio N con centro en el punto 0. Supongamos que en 
el círculo Æ, la función | f (2) | alcanza el mínimo en el punto zo; 
entonces, en particular, se tiene: |f (zo) |< |7 (0) |- 

Fácilmente se observa que en todo el plano complejo la función 
| f (2) | alcanza el mínimo en el. punto xy: si el punto z’ está situado 
fuera de Æ, se tiene |x" | > N, por lo cual, 


IESI O> (0) l- 


Finalmente, de aquí se deduce que f (xo) — 0, o sea, que xo es raiz 
de f (æ); si fuese f (zo) + 0, entonces, por el lema de D'Alembert, 
existiría un punto z, tal que |f (z:) |< |/ (zo) |; sin embargo, 
esto contradice a la propiedad del punto rọ que acabamos de esta- 
blecer, 

En el $ 5; 


se dará otra demostración del teorema fundamental. 
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Sea dado un polinomio de n-ésimo grado, n > 1, 
1) = a03" +a" e ant H an (Mm) 


con cualesquiera coeficientes complejos. De nuevo lo consideramos 
como una expresión algebraica formal, determinada completamente por 
el conjunto de sus coeficientes. El teorema fundamental de 
existencia de la raíz, demostrado en el párrafo anterior, permite afi 
mar la existencia de una raíz æ, de f (z), que puede ser real o compleja. 
Por lo tanto, el polinomio f (z) se puede descomponer en la forma 


15)=—a) q (2). 

Los coeficientes del polinomio q (z) son de nuevo números reales 
o complejos y, por consiguiente, q (z) tiene una raíz az, de donde, 
10 = (a) (242) q (2). 

Continuando de este modo, después de un número finito de opera- 


ciones, obtendremos la descomposición del polinomio f (x) de n- 
ésimo grado en un producto de z factores lineales, 


$ (2) = ao (0) (20) .-- (40). (2) 
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La causa de la aparición del coeficiente ay es la siguiente: si en 
el segundo miembro de la expresión (2) figurase cierto coeficiente b, 
después de abrir paréntesis el término superior del polinomio f (2) 
tendría la forma bz”, mientras que éste es igual a aoz", en virtud 
de (1). Por esto, b = ao. 

La descomposición (2) del polinomio f (x) es la única descompo- 
sición de este tipo, salvo el orden de los factores. 

En efecto, supongamos que haya otra descomposición 

10) = ao (2 — Bi) (2—Ba) - +. (£ — Pn). (3) 
De (2) y (3) se deduce la igualdad 
(201) (1— aa) ... (200) =(2— Py) (2 — Ba) (2 — Ba). (4) 
Si la raíz a; fuese distinta de todas las Bj, j = 4, 2, ..., n, sus- 
lituyendo en (4) a; en lugar de la indeterminada, obtendriamos 
cero en el primer miembro, mientras que en el segundo miembro, 
un número diferente de cero. Por lo tanto, toda raiz œ; es igual 
a cierta raíz By, y viceversa. 

De aquí todavía no se deduce la identidad de las descomposi- 
ciones (2) y (3). En efecto, entre las raíces œ; i= 1, 2,..., n, 
puede haber iguales entre sí. Supongamos, por ejemplo, que $ de 
estas raíces son iguales a %, y que, por olra parte, entre las raíces 
Bri=1, ., n, hay exactamente £ iguales a la raíz %,. Se nece- 
sita demostrar que st 

Como el grado de un producto de polinomios es igual a la suma 
de los grados de los factores, el producto de dos polinomios diferentes 
de cero, no puede ser igual a cero. De aquí se deduce que si dos pro- 
ductos de polinomios son iguales entre sí, ambos miembros de la 
igualdad se pueden simplificar por el factor común: si 


Fa) e (2) =g (2) 4 (0) 
y g (1) 0, de la igualdad 
MG 


(14 ()=0 


se deduce que 


1) —g(2)=0, 
f) =g (2). 


Apliquemos esto a la igualdad (4). Si, por ejemplo, fuese s > £, 
simplificando ambos miembros de la igualdad (4) por el factor (e — 
- et), Megaríamos a una igualdad cuyo primer miembro contend 
el factor £ — æ, mientras que el segundo miembro, no lo contendría. 
Sin embargo, antes se demostró que esto conduce a una contradicción. 
Por lo tanto, la unicidad de la descomposición (2) del polinomio 
f (2) queda demostrada. 


o sea, 
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Reuniendo todos los factores equivalentes, se puede escribir 
la descomposición (2) en la forma* 


2) =00(2— a) (ea)... (ea), (5) 
donde : 
itket- + =2 
Aquí se supone que entre las raíces ay, dx, . . ., œ ya no hay iguales, 


Demostremos que en (5), el número ki, i= 1, 2, ..., L, es el 
orden de multiplicidad de la raíz a; del polinomio f (x). En efecto, 
si este orden es igual a s;, entonces, k; < s, Sin embargo, suponga- 
mos que k; < sı, En virtud de la definición del orden de multi- 
plicidad de la raíz, para f (æ) subsiste la descomposición 


Ho) =(2— a)" q (e). 


Sustituyendo en esta descomposición el factor ¢ (z) por su descom- 
posición en factores lineales, obtendríamos una descomposi 
de f (z) en factores lineales, diversa de la descomposición (2), o se 
llegaríamos a una contradicción con la unicidad de esta descompos 
ción, demostrada anteriormente. 

Por lo tanto, hemos demostrado el siguiente resultado importante: 

Todo polinomio f (x) de grado n, n > 1, de cualesquiera coeficien- 
les numéricos, tiene n raices, contando cada una de las raíces tantas 
veces como sea su orden de multiplicidad. 

Obsérvese que nuestro teorema subsiste también para n — 0, 
puesto que un polinomio de grado cero, no tiene raíces. Este teo- 
rema no se cumple solamente para el polinomio 0, el cual no tiene 
grado alguno y es igual a cero para cualquier valor de z. Esta última 
observación se utilizará para la demostración del siguiente teoren 

Si los polinomios f (z) y g (x) de grado no superior a n, toman 
valores iguales para más de n valores de la indeterminada, entonces 
F (2) = 8 (2). 

En efecto, en nuestras condiciones, el polinomio f (z) — g (x) 
tiene más de n raíces, y como es de grado no superior a n, se cumple 
la igualdad f (z) — g (2) = 0. 

Por lo tanto, teniendo en cuenta que hay una infinidad de diver- 
sos números, se puede afirmar que para dos polinomios f (x) y g (z) 
cualesquiera existen tales valores c de la indeterminada x que | (c) + 
= g (c). Tales c no sólo se pueden hallar entre los números complejos, 
sino también entre los números reales, entre los racionales e incluso 
entre los números enteros. 

Por consiguiente, dos polinomios de coeficientes numéricos que 
tienen diferentes coeficientes, aunque sólo sea en una potencia de la 
indeterminada x, son diversas funciones complejas deila variable 
compleja z. Con esto, queda por fin demostrada para los polinomios 


* So lama descomposición factorial del polinomio f (z). (Nota del T.) 
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de coeficientes numéricos la equivalencia de las dos definiciones de 
igualdad de los polinomios (la algebraica y la teórico-funcional), 
indicadas en el $ 20. 

El teorema demostrado anteriormente permite afirmar que un 
polinomio de grado no mayor que n se determina completamente 
por sus valores para cualesquiera valores distintos de la indeterminada, 
tomados en cantidad mayor que n. ¿Pueden ser arbitrarios estos valo- 
res del polinomio? Si se supone que se dan los valores del polinomio 
para n +4 valores diversos de la indeterminada, la respuesta es 
positiva: siempre eziste un polinomio de grado no mayor que n, que 
tome unos valores prefijados para n - 1 diversos valores dados de 
la indeterminada. 

En efecto, supongamos que se necesita hallar un polinomio de 
grado no mayor que » tal, que para los diferentes valores de la inde- 
terminada ay, 42 a Anss, tome respectivamente los valores 


Cm Cn © ee Casa. Este polinomio es: 
nt 
a Y ula) >> (a) (za) ++ + (24) 
As 2 ía a A) 


1 efecto, su grado no es mayor que n, y el valor f (a) es igual a cj. 
La fórmula (6) se denomina fórmula de interpolación de Lagrange. 
La denominación «de interpolación» se debe a que, conociendo Jos 
valores del polinomio en » -++ 1 puntos, se pueden hallar por csta 
fórmula sus valores en cualesquiera otros puntos. 
Fórmulas de Vieta. Sea dado un polinomio f (x) de grado n cuyo 
coeficiente superior es igual a 1: 
12) =a" -raet i agr" Anst -i Uy 10) 
Y Sean Ay, a, -oy On raíces". Entonces la descomposición 


factorial es 
1) = (20) (20%) ... (24m). 

Multiplicando los paréntesis que figuran en el segundo miembro, 
reduciendo luego los términos semejantes y comparando los coeficien- 
tes obtenidos con los coeficientes de (7), se obtienen las siguientes 
igualdades, denominadas fórmulas de Vieta, que expresan los coe- 
ficientes del polinomio mediante sus raíces: 


t, = — (t F ag- o o H n)a 
(ly = UA H UAH -o E An i Aaa i > H Ann 
2 E Oya), 


a3 = — (004% H- o 


E > 0), 
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Por lo tanto, en el segundo miembro de la /-ésima igualdad, 
k= 1, 2, .. ., n, figura una suma de todos los productos posibles 
de k raíces, tomadas con el signo más o menos, según que & sea par 
o impar. 

Para n = 2, estas fórmulas se convierten en las relaciones entre 
las raices y los coeficientes de un polinomio cuadrático, conocidas 
por el álgebra elemental. Para z —= 3, o sea, para un polinomio 
cúbico, estas fórmulas toman la forn 


— (A lazi 4), 


Uta y ka -j la, Ay = — llo 


Las fórmulas de V 
raices. Asi, pues, hallei 
números 


escritura del polinomio, conocidas sus 
$ (2) de cenar lo modo que los 
úmero 3, raíz múltiple de orden dos. 


a =—(6—2+4+3+3) 

az — 2) 17, 
aa 3 1-5- 33. 
as 5 —2)-3-3—M, 


por lo cual 
f (1) = 21—949 4-173? 1-33 — 90. 


Si el coeficiente superior ay del polinomio f(z) es diferente 
de 1, para la aplicación de las fórmulas de Vieta es necesario dividir 
primero todos los coeficientes por ao, pues esto no influye en las 
raices del polinomio. En este caso, las fórmulas do Vieta dan las 
expresiones para las razones de todos los coeficientes al coeficiente 
superior. 

Polinomios de coeficientes reales. Ahora se deducirán algunas 
consecuencias del teorema fundamental del álgebra de los números 
complejos, referentes a los polinomios de coeficientes reales. Preci- 
samente en estas consecuencias está basada la importancia exclusiva 
del teorema fundamental antes mencionado. 

Supongamos que el polinomio de coeficientes reales 


1) 


tiene la raíz imaginaria æ, o sea, que 


aoz” ~i- a,x" Fan- iln 


aa" Haani pa 0. 


Ya sabemos que no se infringe la última igualdad al sustituir todos 
los números por los conjugados. Sin embargo, siendo reales todos 
los coeficientes do, Aj, . - + @n-i, Up, inclusivo el número 0 que 
figura en el segundo miembro, éstos no se alteran en esta sustitución, 
obteniéndose la igualdad 


aa” + aa" 


Han- $ n 
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o sea, 
1(2)=0. 
Por lo tanto, si un número imaginario «es una raíz de un polinomio 
f (2) de coeficientes reales, el número conjugado a también es una 
raiz de f (0). 
Por consiguiente, el polinomio f (z) es divisible por el trinomio 
cuadrálico 
0()=(1—a) (2-2) = z — (a +- 0) 1+ aa, (8) 


cuyos coeficientes, como ya sabemos por el § 18, son reales. Apli- 
cando esto, demostremos que las raíces a y a del polinomio f (x) són 
de un mismo orden de multiplicidad. 

En efecto, supongamos que los órdenes de multiplicidad de estas 
raíces son Æ y l, y que, por ejemplo, k > /. Entonces f (2) es divi- 
sible por la ¿ósima potencia del polinomio « (2). 


1(0=9 (096). 


El polinomio q (2), como cociente de dos polinomios de coeficientes 
reales, también tiene coeficientes reales, pero, en contra de lo demos- 
trado anteriormente, el número « es raíz de éste de orden (k — 1), 
mientras que el número ©% no es raíz. De aquí se deduce que k = 1, 

Por lo tanto, ahora se puede decir que las raíces imaginarias 
de todo polinomio de coeficientes reales son conjugadas a pares. De 
aquí y de la unicidad de las descomposiciones de la forma (2), 
demostrada anteriormente, se deduce el siguiente resultado final: 

Todo polinomio f (x) de coeficientes reales se descompone de modo 
único (salvo el orden de los factores) en forma de un producto de su 
coeficiente superior ay y de unos cuantos polinomios de coeficientes 
reales, unos de los cuales son lineales de la forma z — æ, correspon- 
dientes a sus raices reales, y otros, son cuadrados de la forma (8), 
correspondientes a los pares, de sus raices imaginarias conjugadas. 

Para lo que sigue, es conveniente subrayar que entre los poli- 
nomios de coeficientes reales con el coeficiente superior 1, solamente 
los polinomios lineales de la forma z—«u y los cuadrados de la 
forma (8), no se descomponen en factores de menor grado o, como 
diremos, son irreducibles. 


$ 


En el curso de análi: 
nales enteras, llamadas 


Fracciones racionales 


s matemático, además do las funciones racio- 
polinomios, se estudian también las funciones 


son los cocientes a de dos funciones ra- 
cionales enteras, donde g(z)-20.Con estas funciones se efectúan operacio- 


ue 


racionales fraccionarias; 
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nes algebraicas según las mismas leyes con que se opera con los núme- 
ros racionales, o sea, como con quebrados de numeradores y denomi- 
nadores enteros. La igualdad de dos funciones racionales fracciona- 
rias o, como en adelante se dirá, de dos fracciones racionales, se 
entenderá también en el mismo sentido que la igualdad de quebrados 
en la aritmética elemental. Para precisar, consideraremos las fraccio- 
nes racionales con coeficientes reales; el lector observará sin difi- 
cultad que todo el contenido del presente párrafo se puede trasladar 
casi palabra por palabra, al caso de fracciones racionales con coeficien- 
tes complejos. 

Una fracción racional se llama irreducible, si su numerador es 
primo con su denominador. 

Toda fracción racional es igual a una fracción irreducible, deter- 
minada univocamente salvo un factor de grado cero, que es común 
para el numerador y denominador. 

En efecto, cualquier fracción racional se puede simplificar por 
cl máximo común divisor de su numerador y denominador, después 
de lo cual resulta una fracción irreducible igual a la dada, Después, 


si las fracciones irreducibles LE) y LW 


n iguales entre sí, o sea, 


gE)” y) * 
si 
1 (2) v()=2£(0) 4 (2), (1) 
como f (2) y g (z) son primos entre sí, por la propiedad b) del $ 21 


se deduce que q (x) es divisible por f (x); y como q (x) y y (x) son 
primos entre sí, resulta que f (7) es divisible por y (2). Por Jo tanto, 
1 (2) = cp (2), y de (1) se deduce que g (z) = e y (2). 

Una fracción racional se dice que es propia, si el grado del nu- 
merador es menor que el grado del denominador, Si convenimos en 
considerar al polinomio O como una fracción propia, subsiste el 
siguiente teorema: 

Toda fracción racional se representa de un modo único en forma 
de una suma de un polinomio y una fracción propia. 

En electo, si se da una fracción racional pay si, dividiendo 


el numerador por el denominador, se obtiene la igualdad 
f(a) =g (2) q (2) +r (2), 


donde el grado de r(z) es menor que el grado de g(z), entonces, 
como fácilmente se comprueba, 


CEDES 
Si también se cumple la igualdad 
Ha a 10) 
ICA 1 
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donde el grado de q (z) es menor que el grado de (z), entonces 
resulta la igualdad 


qn r ga el) y (a)r (a) 
PO ga vs > 
Como en el primer miembro figura un polinomio, mientras que en 
el segundo, una fracción propia, resulta: q(z)—ņq (1)=0 y 
CIMA 
CONTO 
Las fracciones racionales propias pueden ser sometidas a un examen 
ulterior, Recordemos para esto que, como se ha señalado al final 
del párrafo anterior, son polinomios reales irreducibles los de la 
forma z — æ, donde æ es real, y los de la forma 2* — (B + B)z + 
+ BB, donde B y P es un par de números imaginarios conjugados. 
Como fácilmente se comprueba, en el caso complejo desempeñan 
un papel análogo los polinomios de la forma z — æ, donde œ es un 
número complejo cualquiera. 


a)—a)= 


LO so Mama simple, si su denomi- 


nador g (z) es una potencia de un polinomio irreducible p ( 
et) =p (2), k>1, 1 
y el grado del numerador f (x) es menor que el grado de p (2). 
Subsiste también el niente teorema fundamental: 
Toda fracción racional propia se descompone en una suma de 


fracciones. simples. 
Demostración. Consideremos primero la fracción racional pro- 


La fracción racional propia 


Mi 


donde los polinomios g (7) y he (x) son primos entre sí: 
(g(a), h(2)=1. 

Por consiguiente, en virtud del $ 21, existen unos polinomios 

U(x) y v(x) tales que 

glyu (1)+h (z) v (2)=1. 


a 
ON 


De aquí, E S 
g (2) lu (x) f (2)] +A (2) [e (2) f (2)] = f (+). (2) 
Supongamos que dividiendo el producto 1 (x) f (2) por h (a), se 


obtiene un resto u (z), cuyo grado es menor que el grado de A(z). 
En este caso, la igualdad (2) se puede escribir del modo siguiente: 


g (z)u (2) +h (2) v (2) = f (2), (3) 


donde v (2) es un polinomio cuya expresión se podría haber escrito 
sin dificultad. Como el grado del producto g (z) u (2) es menor que 
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el grado del producto g (z)h (z) y esto mismo es cierto, según la 
condición, para el polinomio f (+), el producto h (2) v (x) será también 
de grado menor que g (2) h (2) y, por consiguiente, el grado de v (z) 
será menor que el grado de g (z). De (3) se deduce ahora la igualdad 


150 ro o, ul 


A E A? 
en cuyo segundo miembro figura una suma de fracciones propias. 

Si al menos uno de los denominadores g (z), » (z) se descompone 
en un producto de factores primos entre sí, se puede electuar la 
descomposición ulterior; continuando de este modo, se obtiene que 
cualquier fracción propia se descompone en una suma de unas cuantas 
fracciones propias, cada una de las cuales tiene por denominador 
una potencia de un polinomio irreducible. Más exactamente, 
dada una fracción propia £$}, cuyo denominador posee la descom- 
posición en factores irreducibles 

r 
g(x) = pii (z) plo (z) -.- pi? (2) 


(por supuesto, siempre se puede suponer que el coeficiente superior 
del denominador de la fracción racional es igual a la unidad), siendo 
pi (2) + py (z) para i j, se tiene 

16) 40 uz (2) $ u (z) 

Ed PP Pee d 


todos los términos del segundo miembro de esta igualdad son fraccio- 
nes propias. 

No queda más que considerar una fracción propia de la forma 
u{z) donde p (z) es un polinomio irreducible. Aplicando e) algo- 


ión con resto dividimos u (z) por p'=* (2), Juego, 
el resto obtenido lo dividimos por pA*(x), ete. 
Llegamos a las siguientes igualdades: 
u (x) =p (2) s, (2) + u; (0). 
14, (2) =p)" (2) sa (2) + ua (2), 


Upa (7) = p (2) Sr-1 (7) + un-s (2). 


Como, porla condición, el grado de u (z) esmenor que el grado de p“ (2), 
y el grado de cada uno de los restos w; (z), ¿= 1, 2, k— i, 
es menor que el grado del divisor correspondiente p'=* (2), los 
grados de todos lòs cocientes sı (2), set(2), ..., Sn-ı (2) Serán 
estrictamente menores que el grado del polinomio p (2). El grado 
del último resto ua, (z) será también menor que el grado de p (2). 
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De las igualdades obtenidas, resulta: 
u (x) = p“! (a) s, (2) + p“? (osea) + - -- + p (2) Sus (2) + un-s (2). 


De aquí, obtenemos la representación buscada de la fracción racio- 
u (2) 


r (a) 


ya en forma de una suma de fracciones simples: 
ulz) urate) y mald) 
Pe Pe S a 


El teorema fundamental queda demostrado. Este se puede 

completar con el siguiente teorema de unicidad: 

Toda fracción racional propia posee una descomposición única 
en suma de fracciones simples. 

En efecto, supongamos que alguna fracción propia se puede expre- 
sar de dos modos en forma de una suma de fracciones simples. Restan- 
do una de estas expresiones de la otra y reduciendo los términos 
semejantes, se obtiene una suma de fracciones simples, idénticamente 
igual a cero. Supongamos que los denominadores de las fracciones 
simples que forman esta suma son ciertas potencias de diferentes 
polinomios irreducibles p; (z), pa (2), ..-, pa (£) y sea p" (2) 
la potencia superior del polinomio p; (z), ¿=1, 2, . . ., s, que figura 
entre los denominadores. Multiplicando ambos miembros de la 
igualdad considerada por el producto ph (a)ph (2)... ple (2), 
todos los términos de nuestra suma, menos uno Cr se convierten 
a 


s nta 
INTO 


en polinomios. En lo que so refiere al término 772) TON éste se convierte 


en una fracción cuyo denominador es p, la] y cuyo numerador 
es el producto w (x)p}? (x)... pis(2). El numerador no se 
divide exactamente por el denominador, puesto que el poli- 
nomio py (z) es irreducible y todos los factores del numerador son 
primos con él. Efectuando la división con resto se obtiene que es 
igual a coro la suma de un polinomio y una fracción propia dife- 
rente de cero, lo cual es imposible. 


Ejemplo, Descomponer en una suma de fracciones simples la fracción pro- 
real Le a, donde 
{ (2) = 2r4— 1023-4 72244, 


g (1) = 25—213 | 21?—3r |2. 


Fácilmente se comprueba que 
glz) (z 4-2) (1—1)? (22-41), 


donde cada uno de los polinomios z + 2, z — 1, 2? + 1, 
teoria que acabamos de exponer se deduce que la descomp 


irreducible. De la 
ción buscada tiene 
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que tener la forma 
TOMA ABC | DE 
OT z I G o AA 
donde los números A, B, C, D y E tienen que ser todavía buscados. 
De (4) se deduce la igualdad 
TES A (z —1) DEBA (2? 1-1) HC (z H2) (2—1) (2+1) 4 
+ Da (2+2) (2—1)? +E (z +2) (202, 6 
Identificando los coeficientes de iguales potencias de la indeterminada z en 
ambos miembros de la igualdad (5), obtendríamos un sistema de cinco ecuacio- 
nes lineales respecto a cinco incógnitas, A, B, C, D y E; como se deduce de lo 
demostrado anteriormente, este sistema tiene una solución que además, es única. 
Sin embargo, procederemos de otro modo. 
Poniendo en la igualdad (5) z = —2, obtenemos la igualdad, 454 = 135, 
do donde Ñ > 
(5) 


Poniendo luego en (5) z=1, obtenemos, 6-6, o sea 
B= (7) 
Después de esto, ponemos en la igualdad (5) z = 0 y z = —1, sucesivamente. 
Teniendo en cuenta (6) y (7), obtenemos las ecuaciones 
—2C -4 da 
—4C-AD+4E——8, 


> (4 


(8) 
Do aquí, 
D=1. (9 


Pongamos, finalmente, on la igualdad (5), 22. Teniendo en cuenta (6), (7) 
y (9), llegamos a la ecuación 


200 448 = —52, 
quo junto con la primera de las ecuaciones (8) da 
C=-2, E=—3. 


Por lo tanto, 


16) _ 
Ez 


CAPITULO VI 
FORMAS CUADRATICAS 


$ 26. Reducción de una forma cuadrática a la forma canónica 


La teoría de las formas cuadráticas tiene su origen en la geometría 
analítica, más precisamente, en la teoría de las curvas (y superficies) 
de segundo orden. bien sabido que la ecuación de una curva cen- 
tral de segundo orden en el plano, después de trasladar el origen de 
coordenadas rectangulares al centro de esta curva, tiene la forma 


¿2Bxy + Ci =D. a) 


Se sabe también que se puede efectuar una rotación de los ejes coor- 
denados en un ángulo œ, o sea, un cambio de las coordenadas z, 
y, por las coordenadas z’, y: 


e) 


x =x cosa—y' sena, 
y =x son a-z’ cosa, 


de modo que en las nuevas coordenadas la ecuación de la curva tome 
la forma «canónica»: 


Nan Cy" = D; (3) 


guiente, en esta ecuación, el coeficiente del producto ay” 
de las indeterminadas es igual a cero. Evidentemente, la transfor- 
formación de coordenadas (2) se puede interpretar como una trans- 
formación lineal de las indeterminadas (véase el $ 13), la cual, 
además, no es degenerada, puesto que el determinante de sus coe- 
Ticientes es igual a la unidad. Esta transformación se aplica al pri- 
mer miembro de la ecuación (1). Por lo tanto, se puede decir que 
mediante la transformación lineal no degenerada (2), el primer 
miembro de la ecuación (1) se convierte en el primer miembro de la 
ecuación (3). 

Numerosas aplicaciones reclamaron la elaboración de una teoría 
análoga para el caso en que el número de las indeterminadas, en 
lugar de dos, sea igual a cualquier n, y los coeficientes sean, o bien 
números reales, o bien números complejos cualesquiera. 

Generalizando la expresión que figura en el primer miembro 
de la ecuación (1), llegamos al siguiente concepto. 


por cons 
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Se llama forma cuadrática f en las n indeterminadas z4, Za, +. - 
+... Tp, a una suma, en la cual cada término o es el cua- 
drado de una de estas indeterminadas o es el producto de dos 
indeterminadas diversas. Una forma cuadrática se llama real 
o compleja según que sus coeficientes sean números reales o 
cualesquiera números complejos. 

Suponiendo que en la forma cuadrática f ya se ha hecho la reduc- 
ción de términos semejantes, hagamos las siguientes notaciones para 
los coeficientes de la misma: el coeficiente de xi lo designaremos por 
au y el coeficiente del producto z;rj, para i= j, por 2a;) 
(icompárese con (1)!). Como xx, = zjx, el coeficiente de este 
producto se podría indicar también con la notación 2a;1, o sea, las 
hotaciones introducidas suponen el cumplimiento de la igualdad: 


an= tije (4) 
El término 2a,¿2,2; se puede escribir ahora en la forma 
2a, 2/2) = (4 ¡EL y d+ AZ jT 
y toda la forma cuadrática f, en forma de una suma do todos los tér- 


minos posibles a,yxxj, donde ¿ y j, independientemente uno de 
otro, toman los valores desde 1 hasta n: 


ST 6) 


Si 


en particular, para ¿= j resulta el término ayz} 

Con los coeficientes a;; se puede formar, evidentemente, una ma- 
triz cuadrada A = (a;;) de orden n; ésta se llama matriz de la forma 
cuadrática f, y su rango r, rango de esta forma cuadrática. Ši, en 
particular, r = n, o sea, si la matriz no es degenerada, la forma 
cuadrática f también se llama no degenerada. En virtud de la igualdad 
(4), los elementos de la matriz A, simétricos con respecto a la diago- 
nal principal, son iguales entre sí, es decir, la matriz A es simétrica, 
Recíprocamente, para cualquier matriz simétrica A de orden n se 
puede indicar una forma cuadrática (5) en n indeterminadas, cuyos 
coeficientes son los elementos de la matriz A. 

La forma cuadrática (5) puede ser escrita en otra forma, aplicando 
el producto de matrices rectangulares, definido en el $ 14. Conven- 
gamos primero en hacer las siguientes notaciones: dada una matriz 
cuadrada A, o en general, una matriz rectangular, se designará 
por 4” la matriz que se obtiene transponiendo la matriz A. 
Si las matrices A y B son tales que está definido su producto, 
entonces se cumple la igualdad: 


(By = B'A’, (6) 
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o sea, la matriz transpuesta del producto es igual al producto de las 
matrices transpuestas de los factores, pero tomadas en orden inverso. 

En efecto, si está definido el producto AB, también estará defi- 
nido el producto B'A’, lo que se comprueba fácilmente: el número 
de columnas dela matriz B’ es igual al número de filas de la ma- 
triz A”. El elemento de la matriz (4B)' que figura en su i-ésima fila 
y en su ima columna, está situado en la matriz AB en la j-ósima 
fila e ¡-ósima columna. Por esto, es igual a la suma de los productos 
de los elementos correspondientes de la j-ésima fila de la matriz A 
y de la ¿-ésima columna de la matriz B, o sea, es igual a la suma de 
los produdtos de los elementos correspondientes de la j-ésima columna 
de la matriz A” y de la ¿ésima fila de la matriz B’. Con esto, queda 
demostrada la igualdad (6). 

Obsérvese que la matriz A es simétrica cuando, y sólo cuando, 
ella coincide con su transpuesta, o sea, si 

A =A. 

Designomos ahora con X la columna formada por las indeter- 

minadas: 


La 


X es una matriz do n fi 
matriz se obtiene la matr 


y una columna. Traosponiendo esta 


+ Zn) 


formada por una sola f 
La forma cuadrática (5), cuya matriz es 4-—(4;), se puedo 

escribir ahora en forma del producto: 
(7) 


fa 
En efecto, el producto AX es una matriz formada por una 


columna: 
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Multiplicando por Ja izquierda esta riz por la matriz X’, se 
obtiene una matriz», formada por una fila y una columna, que es 
precisamente el segundo miembro de la igualdad (5). 

¿Qué ocurrirá con la forma cuadrática f si se someten las inde- 
terminadas T, To, .... Z, a una trasformación lineal 


2u= Y quin ¿21,2,...,1, (8) 
e 
de matriz Q = (q:1)? Se supone que, si la forma / es real, también 
tienen que sor reales los elementos de riz Q. Dosignando con Y 
la columna formada por Jas indetern S po ier 


bamos la transformación lin 
tricial: 


=QY. O 
Do aquí, en virtud de (6) 
x=Y0". (10) 
Sustituyondo (9) y (10) en la expresión (7) de la forma f, result 
1=Y'(040) Y, 
1=Y'BY, 
AQ. 


imétrica, puesto que, en virtud de la igualdad (6), 
para cualquier número de factores, 
significa que la matriz A es simétrica, 


o 


dondo 
B 


La matriz B es 
que se cumple ev 
y de la igualdad A’ 
še tiene: 


B' =QNQ=QAQ=B. 


Por lo tanto, queda demostrado el siguiente teorema: 

Una forma cuadrática en n indeterminadas de matriz A, des- 
pués de efectuar una transformación lineal de las indeterminadas 
de matriz Q, se convierte en una forma cuadrática en las nuevas 
indeterminadas, siendo la matriz de esta forma el producto Q'AQ. 

Supongamos ahora que se efectúa una transformación lineal 
no degenerada, o sea, que la matriz Q y, por lo tanto, también la 
matriz Q’, no son degeneradas. En este caso, se obtiene el producto 
Q'AQ multiplicando la matriz A por unas matrices no degeneradas, 
por lo cual, como se deduce de los resultados del $ 14, el rango 
de este producto es igual al rango de la matriz A. Por lo tanto, 
al efectuar una transformación lineal no degenerada, el rango de 
la forma cuadrática no se altera. 
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Veamos ahora, por analogía con el problema geométrico de la 
reducción de la ecuación de una curva central de segundo orden a la 
forma canónica (3), el problema de la reducción de una forma cua- 
drática' arbitraria a la forma de una suma de cuadrados de las inde- 
terminadas, o sea, a una forma en que todos los coeficientes de los 
productos de diversas indeterminadas sean iguales a cero, realizando 
para esto una transformación lineal no degenerada; esta forma espe- 
cial de la forma cuadrática se llama canónica. Supongamos primero 
que, mediante una transformación lineal no degenerada, la forma 
cuadrática f eu z indeterminadas Z;, Za, ..., 2, queda reducida 
a la forma canónica. 


Hby >. + bat (11) 


«londo Yi, Yz, «+ +» Yn son las nuevas indeterminadas. Claro, algu- 
mos de los coeficientes by, Da, ..., On pueden ser iguales a cero, 
Demostremos que el número de coeficientes en (11), diferentes de 
cero, es indispensablemente igual al rango r de la forma f. 

En efecto, como hemos llegado a la (11) mediante una trans- 
formación no degenerada, la forma cuadrática que figura en el segun- 
do miembro de la igualdad (11) también tiene que ser de rango Y. 
Sin embargo, la matriz de esta forma cuadrática tiene la forma diagonal 


40 


Un 


y la exigencia de que esta mat 
a la suposición de que en su diagon 
elementos diferentes de cero. 

Pasemos a la demostraci 
sobre las formas cuadráticas. 

Toda forma cuadrática puede ser reducida a la forma canónica 
mediante una transformación lineal no degenerada. Si es que se con- 
sidera una forma cuadrática real, todos los coeficientes de la trans- 
formación lineal indicada se pueden suponer reales. 

Este teorema subsiste para el caso de formas cuadrál cas en una 
indeterminada, puesto que son de la forma az?, que ya es canónica. 
Por consiguiente, podemos hacer la demostración por inducción 
sobre el número de indeterminadas, es decir, demostrar el teorema 
para las formas cuadráticas en x indeterminadas, suponiendo que 
ya está demostrado para las formas de un número menor de indeter- 
minadas. 


tenga el rango r es equiva ente 
principal figuren ex ctamente 7 


n del siguiente teorema fundamental 
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Sea dada una forma cuadrática 


t= Y Y aziz (12) 
Aï 
en n indeterminadas 7,, £o, . . ., £p. Vamos a procurar hallar una 


transformación lineal no degenerada de tal modo que separe de 
f el cuadrado de una de las indeterminadas, o sea, que convierta a f en 
una suma de este cuadrado y una forma cuadrática en las demás 
indeterminad Este objetivo consigue fácilmente cuando entre 
los coefic entes ay, oz dan que figuran en la diagonal prin- 
cipal de la matriz a forma f h: iguno diferente de cero, o sea, 
cuando en (12) haya por lo menos un cuadrado de una indetermina- 
da z, cuyo coeficiente sea diferente de cero. 

a, por ejemplo, ayy + 0. Entonces, como fácilmente se comprue- 
ba, la expresión a7? (ayz, + aaf a. > amza)? que representa 
una forma cuadrática, contiene los mismos lérminos en la indeter- 
minada z, que nuestra forma f y, por lo tanto, la diferencia que 


IG (Ata ayot ++ tynn)? = g 
será una forma cuadrática que contendrá solamente a las indeter- 
minadas £a, +++, £n, pero no a zy De aqui, que 
05h (austi t drata o o o H AEn) 
Haciendo Jas notaciones 
N=0401 t att e Hamta Yi=2, para ¿=2, 3, ..., n, (13) 
so obtiene 
Ii es (14) 


donde g será ahora una forma cuadrática en las indeterminadas 
Yz, Ya» >> «+ Un: La expresión (14) es la buscada para la forma f, 
puesto que se ha obtenido de (12) mediante una transformación 
lineal no degenerada, inversa a a transformación lineal (13), 
cuyo determinante es a, lo que implica que no sea degenerada. 

Si se cumplen las igualdades. en das dan = 0, 
se debe efectuar previamente una transformación lineal auxi 
que dé lugar a la aparición de cuadrados de las indeterminadas en 
nuestra forma f. Como entre los coeficientes de la expresión (12) 
tiene que haber diferentes de cero — en caso contrario no habria 
que demostrar nada — supondremos que, por ejemplo, 412 Ô, 
o sea, que f es la suma del término 2a,»r;7 y de otros términos, en 
cada uno de los cuales figura por lo menos una de las indetermina- 
das Ts -.., Tae 

Hagamos ahora la transformación lineal 


para i 


z= 


imta Bamir T 22 Y 
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Esta no es degenerada, puesto que su determinante es: 


1—10...0 
E 0D 
0 01...0|=2%0. 
0. Dd 


Como resultado de esta transformac: 
la forma 


n, el término 2a,,2,2 tomará 


2ayot 22 = 2019 (21— 2a) (E1 25) = 20193) — ath, 
es decir, en la forma f aparecerán a la vez los cuadrados de dos inde- 
terminadas con coeficientes diferentes de cero, que no podrán simplj- 
ficarse con los demás términos, puesto que en cada uno de estos 
últimos hay por lo menos una de las indeterminadas 23, ..., zy. 
Ahora nos encontramos en las condiciones del caso considerado 


anteriormente, de modo que con otra transformación lineal más, no de- 
la forma f a la forma (14). 


generada, se podrá redui 

Para terminar la demostración no queda más que señalar que 
la forma cuadrática g depende de un número menor que » de indeter- 
minadas, y por la hipótesis de la inducción, se reduce a la forma 
canónica mediante una transformación no degenerada de las inde- 
terminadas Yo, Ya, - - «+ Yn- Esta transformación, considerada como 
una transformación (que, como fácilmente se comprueba, no es dege- 
nerada) de todas las n indeterminadas, según la cual y, se mantiene 
invariable, reduce (14) a la forma canónica. Por lo tanto, mediante 
dos o tres transformaciones lineales no degeneradas (que se pueden 
sustituir por una sola transformación no degenerada: por su pro- 
ducto), la forma cuadrática f se reduce a una suma de cuadrados 
de las indeterminadas con ciertos coeficientes. Como ya sabemos, 
el número de estos cuadrados es igual al rango r de la forma. Si además 
de esto, la forma cuadrática f es real, los coe 
nica de f, así como en la transformación lineal que reduce f a 
forma, serán reales; en efecto, tanto la transformación lineal invers 
de (13) como la transformación lineal (15) icientes reales, 

El teorema queda demostrado fundamental. El método uti- 
lizado en esta demostración puede aplicarse en ejemplos concretos 
para la reducción efectiva de una forma cuadrática a la forma canó- 
nica. Pero, en lugar de la inducción que se empleaba en la demos 
tración, se aplica el método expuesto para separar sucesivamente 
los cuadrados de las indeterminadas. 


Ejemplo, Reducir la forma cuadrática 


sed [222 —6r9t3 + 22911 (16) 
a la forma canónica. 
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Debido a la ausencia en esta forma de los cuadrados de las indetermina- 
das, efectuamos primero la transformación lineal no degenerada 
Ti Yi— Ya Ti Yi Hb Ta Ya 
de matriz 
110 
A=f1 10], 
o oi 


después de lo cual se obtiene: 
US 

Ahora, el coeficiente de yẹ es diferente de cero y, por esto, en muestra forma so 

puede separar el cuadrado de una indeterminada. Haciendo 


aS 2y ys Y 
o sea, ofeetuando Ja transformación lineal cuya inversa Viene la matriz 
01 
B= 
8 010 


— áyys— 8Yay3. 


i3= ya 


la forma f so reduce a la forma 
a 

zaz 

Por ahora solamente se ha separado el cuadrado de la indeterminada zy, 

puesto que la forma contiene todavía el producto de las otras dos indetermina- 

das. Aplicando la desigualdad de cero del coeficiente de s8, empleamos de nuevo 
el método expuesto anteriormente. Electuando la transformación lineal 

l= 2ni h= 


H= ip 
cuya inversa tiene la matriz 
1 o 0 
1 2 
c=] o -5—2 f. 
o o a 


inalmento, la forma f a la forma canónica 


4-40. an 


so reduce, 
EA 

2 

La transformación lineal que reduce simultáneamente la forma (16) 


a Ja forma,(17) tiene por matriz el producto 


z 
asc=| 1 
z 
o 


$27. Ley de inercia 177 


Mediante una sustitución directa se puede comprobar que la transformación 


2) 


lineal no degenerada (puesto que el determinante es igual a — 


$ 1 
=P UH tatta 


z 


AF ba 


ta 
transforma (16) en (17). 


La teoría de la reducción de una forma cuadrática a la forma 
canónica se ha elaborado por analogía con la teoría geométrica de 
las curvas centrales de segundo orden, pero no puede suponerse que 
es una generalización de esta última. En efecto, en nuestra teoría 
se permitía la aplicación de cualesquiera transformaciones lineales 
no degeneradas, mientras que la reducción de la ecuación de una 
curva de segundo orden a la forma canónica se consigue aplicando 
transformaciones lineales de una forma (2) muy especial, que re- 
presentan rotaciones del plano. Sin embargo, esta teoría geométrica 
se puedo generalizar al caso de formas cuadráticas en n indeter- 
minadas con coeficientes reales. En el cap. 8 se hará una exposición 
de esta generalización, denominada reducción de las formas cua- 
dráticas a los ejes principales. 
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Generalmente, la forma canónica a que se reduce una forma cua- 
drática dada no se determina unívocamento, pues toda forma cua- 
drática se puede reducir a la forma canónica de muchos modos. Así, 
la forma cuadrática f =2zy72 — Özat, + 2ryz, considerada en 


el párrafo anterior, mediante la transformación lineal no degenerada 
TSt 3ta 4 2ta, 


t:—t:— 2, 


so reduce a la forma canónica 
=2% 4 6—8, 
distinta de la obten 


Surge la pregunta 
cuadrálicas canónica 


la anteriormente. 

¿Qué tienen de común las diversas formas 
que se reduce la forma f dada? Como vere- 
mos, esta cuestión está estrechamente ligada con la siguiente pregun- 
ta: ¿cuál es la condición para que una de las dos formas cuadrálicas 
dadas se reduzca a la otra mediante una transformación lineal? 
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Sin embargo, la respuesta a estas preguntas depende de que sean 
reales o complejas las formas emadráticas consideradas. 

Supongamos primero que se consideran formas cuadráticas com ple- 
jas arbitrarias y que, a la vez, se permite el empleo de transfo 
maciones lineales no degeneradas también con coeficientes complejos 
arbitrarios. Ya sabemos que toda forma cuadrática / en » indeler- 
minadas de rango r, se reduce a la forma canónica 


oa tai e 


xý diferentes de cero. 
r la raiz cuadrada de cual- 
ación 


donde todos los coeficientes cy, cz 
Teniendo en cuenta que se puede 
quier número complejo, realicemos la siguiente transform 
lineal no degenerad 


a= Mé para dde Roca 05 zj- yy para Gr a n. 


la forma 
f 253 Hs (1) 


denominada normal, la cual es, simplemente, la suma de los cua- 
drados de r indeterminadas con coeficientes iguales a la unidad. 

La forma normal depende solamente del rango r de la forma f. 
es decir, todas las formas cuadráticas de rango r se reducen a una 
misma forma normal (1). Por consiguiente, si las formas f y g en n 
indeterminadas son de igual rango r, se puede reducir f a la forma (1), 
y después, (1) a la forma g, lo que significa que existe una trans- 
formación lineal no degenerada que reduce f a la forma g. Por otra 
parte, como una transformación lineal no degenerada nunca altera 
el rango de la forma, llegamos al resultado siguiente: 

Dos formas cuadráticas complejas en n indeterminadas se reducen 
una a otra mediante transformaciones lineales no degeneradas con 
coeficientes complejos cuando, y sólo cuando, éstas son de un mismo 
rango. 

De este teorema se deduce sin dificultad que puede ser forma 
canónica de una forma cuadrática compleja de rango r cualquier 
suma de cuadrados de r indeterminadas con cualesquiera coeficientes 
complejos diferentes de cero. 

El asunto se complica si se consideran formas cuadráticas reales 
y, sobre todo, si se permiten solamente transformaciones lineales 
con coeficientes reales, cosa muy importante. En este caso, ya no 
se puede reducir cualquier forma a la forma (1), puesto que proba- 
blemente se tendría que efectuar la extracción de la raíz cuadrada 
de un número negativo. Sin embargo, si llamamos ahora forma normal 
de una forma cuadrática a la suma de los cuadrados de unas cuantas 
indeterminadas, tomadas con los coeficientes —4 o —1, so puede 
demostrar fácilmente, que cualquier forma cuadrática real f se puede 


Esta reduce f a 
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reducira la forma normal mediante una transformación lineal no 
degenerada con coeficientes reales. 

En efecto, la forma f en z indeterminadas, de rango r, se reduce 
a la forma canónica, que se puede escribir del modo siguiente (cam- 
biando la numeración de las indeterminadas, si fuese necesario): 


Ian 
donde todos los números cy, 
de cero y positivos. Entone 


con coeficientes reales z; 
para j rd... n, reduce f a 


=t. 


El número total de cuadrados que figuran aqui es igual al rango 
de la forma. 

Una forma cuadrática real se puede reducir a la forma normal 
mediante muchas transformaciones diversas, pero salvo el orden 
de numeración de las indeterminadas ésta se reduce solamente a una 
forma normal, Esto lo muestra el importante teorema, denominado 
loy de inercia de las formas cuadráticas reales: 

El número de cuadrados positivos, así como el número de cuadrados 
negativos, en la forma normal a que se reduce una forma cuadrática 
dada con coeficientes reales por una transformación lineal real no 
degenerada, no depende de la elección de esta transformación. 

En efecto, supongamos que una forma cuadrática f de rango r, 
en n indeterminadas 3y, s2, .. ., £a Se ha reducido a la forma nor- 
mal de dos modos diversos: 


A E ES 


oo Cai Cran + + Cry Son diferentes 

la transformación lineal no degenerada 

y para i — 1, 2, ..., 7, 27 = yy 
forma normal, 


rot, 
Pad a 2 


SS Dl E da 
=2 Laia R (2) 


Zis Ta, ., Tp a las indeter- 
minadas Yi, Yo, > =, Yn Cr rmación lineal no degenera- 
da, las segundas indetermi se expresarán lincalmente 
mediante las primeras con un determinante diferente de cero: 


m Dasta i 


8) 


ogamente 
zao D bate GA, 
A 


di (4) 


donde el determinante de los coeficientes es de nuevo diferente de 
cero, Los coeficientes en (3). al igual que en (4), son números reales. 
12° 
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Supongamos ahora que k< 1, y escribamos el sistema de igual- 
dades: 


hD A A AEO (5) 


Si los primeros miembros de estas igualdades se sustituyen por sus 
expresiones (3) y (4), se obtiene un sistema de n — Z + Ẹ ecuaciones 
linoales homogéneas con n incógnitas 24, Zo. . . ., £p. El número de 
ecuaciones en este sistema es menor que el número de incógnitas, 
por consiguiente, por el $ 1, este sistema posee solución real no 
nula, Gi, An ...; Apo 
Sustituyamos ahora en la igualdad (2) todas las y y todas las z 
por sus expresiones (3) y (4), y pongamos después en lugar de las 
indeterminadas los números %%;, Ls, . . ., a. Si, para abreviar, se 
designan con y, (a) y zy (æ) los valores de las indeterminadas y: 
y Zj} que se obtienen después de esta sustitución, la igualdad (2) 
se convierte, en virtud de (5), en 
— ps (a)... —yh (a) (a). (6) 
Como todos los coeficientes en (3) y (4) son reales, todos loscuadrados 
que figuran en la igualdad (6) son positivos; por consiguiente, de 
la igualdad (6) se deduce la igualdad a cero de todos estos cuadrados; 
de aquí resultan fas igualdades: 
m(9)=0,..., 21(a)=0. (7) 
Por otra parte, debido a la misma elección de los números 
Qis Aor << An 
zin (a)=0, ..., z(a) =0, ..., Zn (a) = 0. (8) 
Por lo tanto, en virtud de (7) y (8), el 
lincales homogéneas 


ema de n ecuaciones 


A 


con n incógnitas Zy, Za, ..., Zą Posee solución no nula 4, %z, ... 
+ + «y Gn, porlocual, el determinante de este sistema tiene que ser 
igual a coro. Sin embargo, esto es absurdo, puesto que se suponía 
que la transformación (4) era no degenerada. Suponiendo que |< k 
llegamos también a) absurdo. De aquí se deduce la igualdad k = 1, 
que demuestra el teorema. 

El número de cuadrados positivos en la forma normal a que se 
reduce una forma cuadrática real f dada, se llama índice positivo 
de inercia de esta forma; el número de cuadrados negativos, Índice 
negativo de inercia; y la diferencia entre el índice positivo y el nega- 
tivo, signatura de la torma f. Está claro que dado el rango de la forma, 
cualquiera de los tres números que acabamos de definir determina 
completamente a los otros dos y, por esto, en los enunciados que 
siguen se puede mencionar cualquiera de ellos. 


$27. Ley de inercia 181 


Demostremos ahora el siguiente teoremi 

Dos, formas cuadráticas en n indeterminadas con coeficientes 
reales se reducen una a otra mediante transformaciones lineales reales 
no degeneradas cuando, y sólo cuando, tienen el mismo rango y la 
misma signatura. 

En efecto, supongamos que la forma f se reduce a la forma g 
mediante una transformación real no degenerada. Ya se sabe que 
esta transformación no altera el rango de la forma. Esta tampoco 
puede alterar la signatura, puesto que, en caso contrario, las formas f 
y g se reducirían a diferentes formas normales, y la forma f se redu- 
ciría a ambas formas normales, lo cual contradice a la ley de inercia. 
Recíprocamente, si las formas f y g tienen un mismo rango y una 
misma signatura, entonces se reducen a una misma forma normal 
y, en consecuencia, se pueden reducir una a otra. 

Si se da una forma cuadrática g en la forma canónica 


g= Di bait «+ bryt (9) 
con coeficientes reales diferentes de cero, el rango es, evidentemente, 
igual a r, Fácilmente se ve, empleando el método aplicado anterior- 
mente de reducción de esa forma a la forma normal, que el índice 
positivo de inercia de la forma g es igual al número de coeficientes 
positivos en el segundo miembro de la igualdad (9). De aquí y del 
teorema anterior se deduce el siguiente resultado: 

La forma (9) será la forma canónica de una forma cuadrática 
f dada cuando, y sólo cuando, el rango de ésta sea igual a r y su indice 
positivo de inercia coincida con el número de coeficientes positivos 
en (9). 

Formas cuadráticas descomponibles. Multiplicando dos formas 
lineales cualesquiera en n indeterminadas, 


Pa H art n= byt, dodo Dn 


se obtiene, evidentemente, una forma cuadrática. No cualquier 
forma cuadrática se puede representar en fo n producto de 
dos formas lineales, y queremos deducir las condiciones para que 
esto tenga lugar, o sea, para quela forma cuadrática sea descomponible, 
Una forma cuadrática compleja Í (z4, £s, ..., 2) es descompo- 
nible cuando, y sólo cuando, su rango es menor o igual a dos. Una for- 
ma cuadrática real f(x, z2, ..., zn) es descomponible cuando, 
y sólo cuando, su rango no es mayor que la unidad, o es igual a dos, pero 
su signatura es igual a cero. 
Examinemos primero el producto de 
Si al menos una de estas formas es nula, su producto también será 
una forma cuadrática con coeficientes nulos, es decir, tendrá el rango 0. 
Si las formas lineales q y p son proporcionales 


+ cp, 


formas lineales y y Y. 


182 Cap. VI Formas cuadráticas 


siendo c + 0, y la forma y no es nula, supondremos que 4,, por ejem- 
plo, es diferente de cero. Entonces la transformación lineal no dege- 
nerada 


NOR t -o Hanta, Yi T; para i sn 
reduce la forma cuadrática qwp a la forma 
A 


Como en el segundo miembro figura una forma cuadrática de rango 
1, la forma cuadrática qp también tendrá el rango 1. Finalmente, si 
las formas lineales ọ y p no son proporcionales, supondremos que 


a Sl $ 


b, by 


Entonces la transformación lineal 


Ys = at + ay - F antn, 
Ya bar + batnr 
yx; para dB, 4)... n 


no será degenerada; ésta reducirá 
forma 


forma cuadrática y a la 


CTS 

En el segundo miembro figura una forma cuadrática de rango 2, 
que en el caso de coeficientes reales tendrá la signatura 0. 

Pasemos a la demostración de la afirmación recíproca. Por su- 
puesto, una forma cuadrática de rango O puede considerarse como 
el producto de dos formas lineales, una de las cuales es nula, Luego, 
una forma cuadrática f (%1, Za, - - ., Zn) de rango 1, mediante una 
transformación lineal no degenerada, se reduce a la forma 


f=cyi, C#0, 


o sea, a la forma 

f= (ey) Ys 
Expresando linealmente y, mediante Zi, Za, .-., Zn, se obtiene 
la representación de la forma f en un producto de dos for- 
mas lineales. Finalmente, una forma cuadrática real f (21, 22, 
a, Zn) de rango 2 y signatura 0, mediante una transformación 
wal no degenerada, se reduce a la forma 


f=; 
a esta misma forma se puede reducir cualquier forma cuadrática 
compleja de rango 2. Sin embargo, 


(Y1 — Ya) Y + Ya)» 
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y en el segundo miembro, después de sustituir y, y yə por sus expre- 
siones lineales mediante 2, Za, . . ., Zn, resultará el producto de 
dos formas lineales. Así, el teorema queda demostrado. 
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Una forma cuadrática / en n indeterminadas con coeficientes 
reales se llama definida positiva, si se reduce a una forma normal 
que consta de n cuadrados positivos, es decir, si tanto el rango como 
el índice positivo de inercia de esta forma son iguales al número 
de las indeterminadas. 

El siguiente teorema da la posibilidad de caracterizar las formas 
definidas positivas, sin reducirlas a la forma normal o canónica. 

Una forma cuadrática f en n indeterminadas x,, £2, . . ., tp con 
coeficientes reales, es definida positiva si, y sólo si, para cualesquiera 
valores reales de estas indeterminadas, no simultáneamente nulos, 
la forma toma valores positivos, 

Demostración. Supongamos que la forma f es definida positiva, 
o sea, que se reduce a la forma normal 


I=N+Yi++.Yyh (1) 
donde 
n= Jta tal, Doa i (2) 
A 


siendo diferente de coro el determinante de los coeficientes reales ayy. 
Si se quieren poner en j valores reales arbitrarios de las indetermi- 
nadas zı, Ze . . ., Zn, al menos uno de los cuales es diferente de 
coro, se pueden ponerlos primero en (2) y, después, los valores obte- 
nidos de y;, en (1). Obsérvese que los valores obtenidos en (2) para yy, 
Yz, «++ Uns no pueden ser simultáneamente iguales a cero, puesto 
que en caso contrario resultaría que el sistema de ecuaciones linea- 
les homogéneas 


a 


Y ajj — i=4,2, 
É 


poseería solución no nula a pesar de que su determinante es diferente 
de cero. Sustituyendo en (1) los valores obtenidos de y1, Yo, -. «+ Yn 
se obliene un valor de la forma f, igual a la suma de los cuadrados 
de n números reales que no son todos iguales a cero; por consiguiente, 
este valor es estrictamente positivo. 

Recíprocamente, supongamos que la forma f no es definida posi- 
tiva, o sea, que su rango o su índice positivo de inercia es menor 
que n. Esto significa que en su forma normal, a la que se reduce 
mediante una transformación lineal no degenerada (2), el cua- 
drado de al menos una de las indeterminadas, por ejemplo, de yn, 
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o bien falta, o bien figura con el signo menos. Demostremos que en 
este caso se pueden elegir para las indeterminadas Ty, t2, + + «+ Zn 
unos valores reales, no todos iguales a cero, de modo que el valor 
de esta forma para estos valores de las indeterminadas sea igual 
a cero e incluso negativo. Tales son, por ejemplo, los valores que 
se obtienen para z, £a, « » =» Zn al resolver por la regla de Cramer 
el sistema de ecuaciones lineales que resulta de (2) para y, = Ya = 
=... = Yn- = Ô, Ya = 1. En efecto, para estos valores de las 
indeterminadas zi, Tz, >. ., Zn la forma es igual a cero, si y} no 
figura en la forma normal, e igual a —4, si yå figura en la forma nor- 
mal con el signo menos. 

El teorema que acabamos de demostrar se emplea en todos los 
casos donde se aplican las formas cuadráticas definidas positivas. 
Sin embargo, con su ayuda no se puede determinar, valiéndose de 
los coeficientes de la forma, si ésta es definida positiva o no. Para 
este fin sirve otro teorema que enunciaremos y demostraremos 
después de que se introduzca un concepto auxiliar. 

Sea dada una forma cuad a f en n indeterminadas de matriz 
A = (a1,). Los menores de orden 1, 2, . . .. r de esta matriz, situa- 
dos en el ángulo superior de la izquierda, o sea, los menores 


Ay Ap de Bi 
May a22 +++ Gak Mas Mag +++ on 
Ars Arz ++ Anh Any Anz +++ Ann 


el último de los cuales, evidentemente, coincide con el determinante 
de la matriz A, se llaman menores principales de la forma f. 

Subsiste el siguiente teorema: 

Una forma cuadrática f en n indeterminadas con coeficientes 
reales es definida positiva si, y sólo si, todos sus menores principales 
son estrictamente positivos. 

Demostración. El teorema es cierto para n =1, puesto que en este 
caso la forma es az? y, por lo tanto, es definida positiva si, y sólo 
si, a>0. Por esta razón demostraremos el teorema para el 
caso de n indeterminadas, suponiendo que ya está demostrado para 
las formas cuadráticas en r — 1 indeterminadas. 

Hagamos primero la observación siguiente: 

Si una forma cuadrática f con coeficientes reales que forman una 
matriz A, se somete a una transformación lineal no degenerada de 
matriz real Q, el signo del determinante de la forma (o sea, del deter- 
minante de su matriz) no varía. 

En efecto, después de la transformación se obtiene una forma 
cuadrática cuya matriz es QAQ; pero, como | Q | = |Q |, resulta: 


19'401=101-141-101=141-101, 
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o sea, el determinante | 4 | se multiplica por un número positivo. 
Supongamos ahora que se ha dado una forma cuadrática 


= Y, ties. 


i, F=! 


Esta se puede escribir en la forma 


Í= (2s a ~- zn) +2 D AintiLn $ Ann Thy (3 


donde q es una forma cuadrática en n — 1 indeterminadas, formada 
por los términos de la forma f que no contienen a la indeterminada z}. 
Obsérvese que los menores principales de la forma q coinciden con 
todos los menores principales de la forma f, menos con el último. 

Supongamos que la forma f es definida positiva. En este caso, 
la forma «p también será definida positiva, pues si existiesen unos 
valores de las indeterminadas z4, z2, . . ., Zn, ho simultáneamente 
nulos, para los que la forma «p tomase un valor no estrictamente 
positivo, entonces, poniendo complementariamente z, — 0, en 
virtud de (3), se obtendría también un valor no estrictamente posi- 
tivo para la forma f, a pesar de que no todos los valores de las inde- 
torminadas Z4, 22, . >., Zh-1, Zp Son iguales a cero. En consecuencia, 
según la hipótesis de inducción, todos los menores principales de 
la forma «y, es decir, todos los menores principales de la forma f, 
menos el último, son estrictamente positivos. En lo que se refiere 
al último menor principal de la forma f, o sea, al determinante de 
la misma matriz A, éste es positivo debido a las razones siguientes: 
como la forma f es definida positiva, mediante una transformación 
lineal no degenerada, ésta se reduce a la forma normal que consta 
de n cuadrados positivos. El determinante de esta forma normal 
es estrictamento positivo y, por esto, en virtud de la observación 
hecha anteriormente, es también positivo el determinante de la 
misma forma f. 

Supongamos ahora que todos los menores principales de la for- 
ma f son estrictamente positivos. De aquí se deduce que son positi- 
vos todos los menores principales de la forma y, y por la hipótesis 
do inducción, ésta es definida positiva, Por consiguiente, existe 
una transformación lineal no degenerada de las indeterminadas 
Zi, Ze, . - -y Zn—1 que reduce la forma 4 a una suma de n — 1 cua- 
drados positivos do las nuevas indeterminadas y} Yo, ..., Yn=5 
Esta transformación lineal se puede completar hasta una trans 
formación lineal (no degenerada) de todas las indeterminadas 
Zi, Za, . - + Za, haciendo Za = yn. En virtud de (3), mediante la 
transformación indicada, la forma f se reduce a la forma 


nt 
f= X +2 Y binyiYn + bangis (wm 
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Las expresiones exactas de los coefici 
alguno. Como 


tes bin no tienen interés 


Yi + 2binYiYn = (Vi + Dina" — ni, 
en virtud de (4), la transformación lineal no degenerada 


Zi = Yi + binYns i=4,2,...,r—i, 
In Yn 


reduce la forma f a la forma ca 
nas 
1-33 6) 


Para demostrar que la forma f es definida positiva, no queda 
más que demostrar que el número c es positivo, El determinante 
de la forma que figura en el segundo n bro de la igualdad (5) 
es igual a c. Sin embargo, este detern nte tiene que ser positivo, 
puesto que el segundo miembro de la igualdad (5) se ha obtenido 
de la forma f mediante dos transformaciones lineales no degeneradas, 
y el determinante de la forma f, como último de los menores princi- 
pales de ésta, es positivo. 

Así, pues, el teorema queda demostrado, 


La forma cuadrática 
Potts 
inida positiva, ya que sus menores principales 


573442129 —Sz 12942929 


ica 
J=3r} Hatt 5r} 4 411981129 — 2929 
no es definida positiva, puesto que su segundo menor principal es negativo 
3214 

21 


Obsérvese que por analogía con las formas cuadráticas defini- 
das positivas se pueden definir las formas definidas negativas, o sea, 
unas formas cuadráticas no degeneradas con coeficientes reales cuyas 
formas normales contienen solamente cuadrados negativos de las inde- 
terminadas. Las formas cuadráticas degeneradas, cuyas formas normales 
constan de cuadrados de un mismo signo, se llaman a veces semide- 
finidas. Finalmente, las formas cuadráticas, cuyas formas normales 
contienen cuadrados de las indeterminadas, tanto positivos como 
negativos, son indefinidas. 


CAPITULO VII 
ESPACIOS LINEALES 


$ 29. Del 


a definición de espacio vectorial de n dimensiones dada en 
el $ 8, comenzaba con la definición de un vector de n dimensiones 
como un sistema ordenado de n números. Para los vectores de n 
dimensiones se definieron luego la suma y el producto de ellos por núme- 
ros, lo cual condujo a la noción de espacio vectorial de n dimensiones. 
Los primeros ejemplos de espacios vectoriales son los conjuntos 
de vectores-segmentos que parten del origen de coordenadas, en el 
plano o en el espacio tridimensional. Sin embargo, tratando 
estos ejemplos en el curso de geometría, no siempre creemos 
necesario determinar los vectores por sus componentes respecto a un 
sistema fijo de coordenadas, puesto que la suma de vectores y su 
producto por un escalar se determinan geométricamente, indepen- 
dientemente de la elección del sistema de coordenadas, Precisamente, 
la suma de vectores en el plano o en el espacio se efectúa según la 
regla del paralelogramo y el producto de un vector por un número æ 
significa el alargamiento de este vector en a veces (o la contracción, 
teniendo que cambiar la dirección del vector por la contraria en 
caso de que æ sea negativo). En el caso general, también es conveniente 
hacer una definición «sin recurrir a coordenadas» del espacio vecto- 
rial, es decir, hacer una definición que no necesite determinar los 
vectores como sistemas ordenados de números. Ahora se dará tal 
definición. Esta definición es axiomática, pues en ella no se tratará 
de las propiedades de cada vector por separado, sino quese enumerarán 
las propiedades que deben poseer l con los vectores. 

Sea dado un conjunto V; si 1 con letras 
latinas minúsculas: a, b, c, ...*. Supongamos también que en el 
conjunto Y se han definido las operaciones siguientes: /a suma, 
que pone en correspondencia a cada par de elementos a, b de V un 
elemento univocamente determinado a «+ b de V, denominado suma, 


ición del espacio lineal. Isomorfismo 


* A diferencia de lo convenido en el capítulo 2, en el presente capítulo 
y en el siguiente, los vectores se designarán con letras latinas minúsculas, mien- 
iras que los números, con letras griegas minúsculas, 
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y la multiplicación de un elemento por un número real, según la cual, 
el producto aa del elemento a por el número a está univocamente deter- 
minado y pertenece a V. 

Los elementos del conjunto V se llamarán vectores y el mismo 
conjunto V, espacio lineal ( o vectorial, o afin) real, si las operaciones 
indicadas poscen las propiedades 1—VIIL que siguen: 

a suma es conmutativa, a > b = b 
suma es asociativa, (a } b) c = a+ (b-c). 


ME E 


teen V un elemento nulo (cero) O, que satisface a la con- 
dición: a + 0 = a para todos los a de V. 
Aplicando I, es fácil demostrar la unicidad del elemento nulo: 


si 0, y Oz son dos elementos nulos, se tiene: 
D; + 0a =05, O; + 0z = 0z + O; = Oz, 

de donde 0, = 

IV. Para todo clemento a de V existe un elemento opuesto — 
que satisface a la condición: a + (—a) = 0. 

Fácilmente se comprueba, en virtud de H y I, la unicidad del 
elemento opuesto: si (—a)}, y (—a)z son dos elementos opuestos de a, 
entonces, 


(~a) + le + (dal -= (~a) +0 
K— a) al +(— a) =0+(=4%= 


de donde (—a), = (~a) 
De los axiomas I—IV se deduce la existencia y unicidad de la 


diferencia a — b, o sea, de un elemento que satisface a la ecuación 
b4+-z=a. (Mm) 
En efecto, se puede poner 
a—b= A): 


pues 

DH la + (—DI= b+ (b+ a=0 4 a= 
Si existiese otro elemento más, c, que satisfaciese a la ecuación (1), 
O sea, que 


ba 
agregando a los dos miembros de esta igualdad el elemento — b, 
resultaría 


=a, 


c=a4-{—b). 

Los axiomas V—VIII que siguen (compárese con el $ 8), li 

la multiplicación por un número con la suma y con las operaciones 

sobre los números. Precisamente, para cualesquiera elementos a, 

b de V, para cualesquiera números reales æ, $ y para el número real 1, 
se tienen que cumplir las igualdades: 


v. a (a+ b) = aa + ab; 


$ 29. Definición del espacio lineal. Isomorfismo 189 


vi. 
vil. 
VII. 


Señalemos algunas de las propiedades elementales de estos 
axiomas: 


11 a-0=0. 
En efecto, para un a de V, 


aa=ala +0) =aa--a-0, 
o sea, 
a-0=aa—aa = aa + | — (2a)] =0, 
2 0.a=0, 
donde en el primer miembro figura el número cero, mientras que en 
el segundo miembro, el elemento nulo de V. 
Para la demostración, tomemos cualquier número œ. Entonces 


aa = (a+ 0)a==aa +0.a, 
de donde 


0-a=aa—aa=0. 


13]. Si aa =0, entonces a+==0, o bien a= 0. En efecto, si a 0, 
es decir, que existe el número a”!, entonces 


a=t-0-(0ta)a=0 (aa) =01.0=0. 

141. a(—a)= — an. 
En efecto, 
aa- a(—a)=ala+(—a)=a-0=0, 

o sen, el elemento a (—a) es opuesto al elemento «a. 
151. (—aja- 
En realidad, 

ar (—0)a=|a-+(—a) a 0-40, 
o sea, el elemento (—a)a es opuesto al elemento «a. 
161. ala—b)=a0—ab. 
En efecto, en virtud de [4], tendremos 
ala —b) = aja + (— b) = aa + a (— b) = aa + (— ab) =u0—ab. 
17. (a—p)a =aa— pa. 
Se tiene, en efecto 


(e—a = a+ (BN a= aa + (—P) a = aa + (— ha) = aa — Pa. 
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consecnencias enumeradas 
¡ales. 

cio lineal real. Suponiendo 
que en el conjunto V no sólo se ha determinado el producto por 
números reales, sino también por cualesquiera números complejos 
conservando los mismos axiomas I-VIII, se obtiene la definición 
de espacio. lineal complejo. Para fijar ideas, se examinarán a con- 
tinuación los espacios lineales reales; sin emabargo, todo lo que 
se diga en el presente capítulo se refiere también palabra por pa- 
labra al caso de espacios lineales complejos. 

Es fácil señalar ejemplos de espacios 1 Estos son, 
anto todo, los espacios vectoriales reales de n dimensiones formados 
s, que se estudiaron en el cap. 2. También son 
onjuntos de vectores-segmentos que parten 
del origen de coordenadas en el plano o en el espacio tridimensional, 
si las operaciones de suma y de multiplicación por un número se 
entienden en el sentido geométrico que se indicó al comienzo 
de este párrafo. 

También e omplos de espacios lineales, como suelo decirse, 
de «infinitas dimensiones». Consideremos todas las sucesiones posi- 
bles de números reales; éstas son de la forma 


ed 


Las operaciones con las sucesiones se efectúan componente a compo- 


nente: si 
b= (Br Pa 


Obsérvese que I 
se emplearán a continui 
Antes se dio la definic 


espacios lin 


a= (aan, - 


se tiene 
a4 b= (a Bi aa 


por otra parte, para cualquier 


va = (Var Vaz 


Todos los axiomas I—VIII se cumplen, o sea, resulta un espacio 


lineal real. 

Un ejemplo de espacio de infinitas dimensiones es también el 
conjunto de todas las funciones reales posibles de la variable real, 
entendiendo por suma de funciones y su producto por un número 
real lo que está convenido en la teoría de las funciones, es decir, 
como la suma y el producto por un número de los valores de las funcio- 
nes para cada valor de la variable independiente, 

Isomorfismo. Nuestro objetivo próximo consiste en la elección, 
entre todos los espacios lineales, de aquellos que naturalmente se 
pueden llamar espacios de dimensiones finitas. Introduzcamos pri- 
mero un concepto general. 
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En la «definición de espacio lineal se hablaba de las propiedades 
de las operaciones sobre los vectores, pero no se decía nada de las 
propiedades de los mismos vectores, En virtud de esto, puede ocurrir 
que, aunque los vectores de dos espacios lineales dados sean comple- 
tamente distintos por su naturaleza, estos dos espacios no se distin- 
gan en nada desde el punto de vista de las propiedades de las opera- 
ciones. La definición exacta es: 

Dos espacios lineales reales V y V’ se llaman ¿somorfos, si entre 
los vectores de los mismos se ha establecido una correspondencia 
biunívoca —de modo que a cada vector a de V se asocia un vec- 
tor a? de V’, llamado imagen del vector a, teniendo que tener dife- 
rentes vectores de V diferentes imágenes y teniendo que ser cada 
vector de V’ la imagen de cierto vector de V— y si en esta corres- 
pondencia, la imagen de la suma de dos vectores es la suma de 
las imágenes de los mismos 


(ad a, e 

y la imagen del producto de un vector por un número es el producto 
de la imagen de este vector por este mismo número, 

(ua) = an. (3) 


eñalemos, que la correspondencia biunivoca entre los espacios V 
y V’ que satisface a las condiciones (2) y (3), se llama correspon- 
dencia de isomorfismo. 

Así, pues, el espacio de los vectores-segmentos en el plano, que 
parten del origen de coordenadas, es isomorfo al espacio vectorial 
de dos dimensiones formado por pares ordenados de números reales: 
so obtiene una correspondencia de isomorfismo entre estos espacios, 
si en el plano se fija un sistema de coordenadas y a cada vector-seg- 
mento se asocia el par ordenado de sus coordenadas. 

Demostremos la siguiente propiedad del isomorfismo de los e 
cios lineales: 

en una correspondencia de isomorfismo entre los espacios V y V', 
la imagen del cero del espacio V es el cero del espacio V’. 

En efecto, sea a un vector de V y sea a” su imagen en V’, Enton- 
ces, en virtud de (2), 
a= (a4 OY -=a 40, 


es decir, 0 es el cero del espacio V’. 


tas. Bases 


$ 30. Espacios de dimensiones fi 


Como fácilmente puede comprobar el lector, las dos defini- 


ciones de dependencia lineal de los vectores-filas que se hicieron 
en el $ 9, así como la demostración de su equivalencia, empleaban 
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solamente las operaciones con los vectores y, por lo tanto, se pueden 
generalizar para el caso de espacios lineales cualesquiera. Por esta 
razón, en los espacios lineales definidos axiomáticamente se puede 
hablar de sistemas de vectores linealmente independientes, de sis- 
temas linealmente independientes máximales (en caso de que exis- 
tiesen), etc. 

Si los espacios lineales V y V’ son isomorfos, entonces un sistema 
de vectores ay, az, . . ., Ax de V es linealmente dependiente si, y solo 
si, es linealmente dependiente el sistema de sus imágenes Aj, ap .. 
o. E S 

Obsérvese, que si la correspondencia a —> a’ (para todos los a 
de V) es una correspondencia de isomorfismo entre V y V’, enton- 
ces la correspondencia inversa a” —> a también es de isomorfismo. 
Por esto, es suficiente examinar el caso en que el sistema a, 
as, +... a, sea linealmente dependiente. Supongamos que existen 
UNOS NÜMETOS Qy, Qs, . . ., Qa, no simultáneamente iguales a cero, 
tales que 


an, + aaa- -Hana 0. 


Como ya sabemos, la imagen del segundo miembro de esta igualdad 
en el isomorfismo considerado esel cero 0” del espacio V’. Tomando la 
imagen del primer miembro y aplicando unas cuantas veces (2) 
y (3), se obtiene: 


aaa... ba =O, 


o sea, el sistema aj, dj, .. . ah resulta tam 
diente, 

Espacios de dimensiones finitas. Se dice que un espacio lineal V 
es de dimensión finita, si se puede hallar en él un sistema finito de 
vectores linealmente independiente maximal; cualquier sistema tal 
de vectores se denominará base del espacio V. 

Un espacio lineal de dimensión finita puede poseer muchas bases 
diversas. Así, en el espacio de vectores-segmentos en el plano, cual- 
quier par de vectores, diferentes de cero y no situados en una recta, 
forma una base. Obsérvese, que nuestra definición de espacio de di- 
mensión finita no responde a la pregunta si pueden existir o no en 
este espacio bases, compuestas de diferente número de vectores. 
Incluso, se podría suponer que en algunos espacios de dimensión 
finita existan bases con un número arbitrariamente grande de vecto- 
res. Ahora aclararemos la situación real existente. 

Supongamos que el espacio lineal V posee una base 


€ €2 +=.» êm (41) 


compuesta de n vectores. Si a es un vector arbitrario de V, como (1) 
es un sistema linealmente independiente maximal, a se expresa 


n linealmente depen- 
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linealmente mediante este sistema: 
Hasen ooo + no B 


Por otra parte, como el sistema (1) es linealmente independiente, 
la expresión (2) del vector a es única: 


a= te, 


si 
a= ajet aert n H Ahen 
se tiene 
(a1 — ai) er A- (La — 0%) e+ o o « A (On — An) En 
de donde 


a=an imi, 2, eon n 
Por lo tanto, al vector a le corresponde unívocamente la fila 
+ An) (3) 


de los coeficientes de su expresión (2) mediante la base (1) o, como 
vamos a decir, la fila de sus coordenadas en la base (1). Recíproca- 
mento, toda fila de la forma (3), o sca, todo vector de z dimensiones 
en el sentido del cap. 2, es una fila de coordenadas en la base (1) para 
cierto vector del espacio V, precis nte para el vector que se expre- 
sa en la forma (2) mediante la base (1). 

Por consiguiente, hemos obtenido una correspondencia biunívoca 
entre todos los vectores del espacio V y todos los vectores del espacio 
vectorial de filas de z dimensiones. Demostremos que esta correspon- 
dencia que, naturalmente, depende de la elección de la base (1), 
es una correspondencia de isomorfismo. 

Tomemos también en el espacio V, además del vector a, que se 
expresa mediante la base (1) en la forma (2), un vector b, cuya expre- 
sión mediante la base (1) s 


b= Biei i- Pacs + 


(2i a, 


«+ Brén» 
Entonces 
a +b = (a + Pi) es + (% + Po) e2- -+ © + (dîn + Bn) Ens 
es decir, a la suma de los vectores a y b le corresponde la suma de las 
filas de sus coordenadas en la base (1). Por otra parte, 
va = (pay) e, = (9%) ez ©- © + (VAn) ens 

o sea, al producto de un vector a por un número y le corresponde el 
producto de la fila de sus coordenadas en la base (1) por este mismo 
número y. 

Con esto, queda demostrado el teorema siguiente: 

Todo espacio lineal que posee una base de n vectores es isomorfo 
a un espacio vectorial de filas de n dimensiones. 

Como ya sabemos, en una correspondencia de isomor! 
los espacios lineales, a un sistes 


13 


mo entre 
a de vectores linealmente depen- 
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diente le corresponde otro sistema linealmente dependiente, y vice- 
versa; por lo tanto, a un sistema linealmente independiente le corres- 
ponde otro sistema linealmente independiente, De aquí se deduce 
que en una correspondencia de isomorfismo, a la base le correspon- 
de una base, 

En efecto, supongamos que en una correspondencia de isomorfis- 
mo entre los espacios V y V’, a la base es, £o, - -» en del espacio V 
le corresponde el sistema de vectores ej, ez, . . ., €a del espacio V’ 
que, aunque sea Jinealmente independiente, no es maximal, Por 
consiguiente, en V’ se puede hallar un vector f’ tal, que el sistema de 
VOCLOTesS ej, Cp >- €, f’ se mantenga linealmente independiente, 
Sin embargo, en el isomorfismo considerado, el vector f’ es la ima- 
gon de cierto vector f de V. Resulta, entonces, que el sistema de vec- 
LOTES Ci, Ca, --., Ens f tiene que ser linealmente independiente, lo 
que contradice a la definición de la base. 

Ya sabemos, que en el espacio vectorial de filas de » dimensiones 
(véase $ 9), todos los sistemas linealmente independientes maximales 
constan de n vectores, que cualquier 1 vectores es 
linealmente dependiente y que cualquier sistema de vectores lineal- 
mente independiente está contenido en un sistema linealmente inde- 
pendiente maximal. Aplicando las propiedades de las corresponden- 
cias de isomorfismo, establecidas anteriormente, llegamos a los 
resultados siguientes. 

Todas las bases de un espacio lineal V de dimensión finita constan 
de un mismo número de vectores, Si este número es igual a n, V se 
lama espacio lineal de n dimensiones y el número n, dimensión de este 
espacio. 

Todo sistema de n > 1 vectores de un espacio lineal de n dimen- 
siones es linealmente dependiente, 

Todo sistema de vectores linealmente independiente de un espacio 
lineal de n dimensiones está contenido en una base de este espacio. 

Ahora, es fácil comprobar que los ejemplos de espacios lineales 
reales indicados anteriormente, el espac: sucesiones y el espacio 
de funciones, no son espacios de dime rita, pues, en cada uno 
de ellos el lector hallará sin dificultad sistemas linealmente indepen- 
dientes que constan de un número de vectores arbitrariamente 
grande. 

Relación entre las bases. El objetivo de nuestro estudio son los 
espacios lineales de dimensión finita. Se entiende que al estudiar los 
espacios lineales de n dimensiones, se estudia realmente, el espacio 
vectorial de filas de z dimensiones que se introdujo en el cap. 2. 
Sin embargo, en este espacio se había elegido antes una base, 
en la que todos los vectores del espacio se determinaban por las 
filas de sus coordenadas; precisamente la base compuesta por los 
vectores unitarios, o sea, por los vectores que tienen una coordenada 
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igual a la unidad y todas las demás iguales a cero; ahora, todas las 
bases del espacio son para nosotros equivalentes. 
Veamos la cantidad de bases que se pueden hallar en el espacio 
lineal de n dimensiones y cómo están ligadas estas bases entre sí. 
Supongamos que en el espacio lineal V de n dimensiones se han 
dado las bases 
tinte (4) 
y 
CAC (5) 
Cada vector de la base (5), del mismo modo que cada vector del espa- 
cio V, se expresa unívocamente mediante la base (4), 


e= Y tjen 1,2, 
¡A 


(6) 


La matriz 


cuyas filas son filas de las coordenadas de los vectores (5) en N: 
base (4), se denomina matriz de cambio de la base (4) por la base (5). 

En virtud de (6), la relación entre las bases (4) y (5) y la matri: 
de cambio 7 se puede expresar en forma de una igualdad matricial: 


e | Graa: G a 
e €; 
g 2 
É Toy Toz >> Ton s 
i (mm 
en ln Tra >>> Tom en 


o, en la forma: 


e =Te. 


donde con e y e”, so han designado, respectivamente, las bases (4) 
y (5) escritas en columna. 


Por otra parte, si 7” es la matriz de cambio de la base (5) 
por la base (4), se tiene 

e=Te. 

e=(T'T)e, 

e= (TT), 
son linealmente independientes, resulta 
TT=TT'=E, 


De aquí 


y, como las bases e y e 


de donde 
a 
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Con esto, queda demostrado que ja matriz de cambio de una base 
por otra es siempre una matriz no degenerada, 

Toda matriz cuadrada no degenerada de orden n con elementos 
reales es la matriz de cambio de una base dada del espacio lineal real 
de n dimensiones por otra base. 

En efecto, supongamos dada la base (4) y la matriz 7, de orden 
n, no degenerada. Tomemos por (5) el sistema de vectores, para los 
que las filas de la matriz 7 son filas de coordenadas en la base (4); 
por consiguiente, se cumple la igualdad (7). Los vectores (5) son 
linealmente independientes, puesto que la dependencia lineal entre 
ellos daría lugar a la dependencia lineal de las filas de la matriz 7, 
lo cual es absurdo, pues 7 no es degenerada. En consecuencia, el 
sistema (5), siendo linealmente independiente y constando de n vec- 
tores, es una base de nuestro espacio y la matriz 7 es la matriz de 
cambio de la base (4) por la base (5). 

Vomos, pues, que en el es; de n dimensiones se pueden 
hallar tantas bases diversas, cuantas matrices cuadradas diversas 
no degeneradas de orden z existan. Claro que, en este caso, dos bases 
que consten de los mismos vectores, pero escritos en orden diverso, 
se consideran diferentes. 

Transformación de las coordenadas de un vector. Supongamos que 
en el espacio lineal de n dimensiones se han dado las bases (4) y (5) 
con la matriz de cambio T = (t;;), 


'=Te. 
Hallemos la relación existente entre las filas de coordenadas de un 


vector arbitrario a en estas bases. 
Supongamos que 


(8) 


Aplicando (6), resulta: 


a= 323 10) = 


Comparando con (8) y aplicando la un: 
vector mediante la base, se obtiene: 


aj= AT 
o sea, se cumple la igualdad matricial: 
(an Aa 2, An) = (2i 
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Por lo tanto, la fila de coordenadas de un vector a en la base e es 
igual a la fila de coordenadas de este vector en la base e*, multiplicada 
a la derecha por la matriz de cambio de la base e por la base e”. 

Naturalmente, de aquí se deduce la igualdad 

(js Qis o, An) = (Qi As ~.. On) T. 
Ejemplo. Examinemos el espacio lineal real de tres dimensiones con la base 
Eir en eg. (9) 


Los vectores 

e =5e—e—2e 
2e1-+3e, 
4=—2 


E 


(10) 


ee 
tambión forman una base en este espacio, siendo 


5—1 —2 
r-( 2.3 o). 
-2 4 4 
la matriz de cambio de (9) por (10); de donde 


3—1 6 
mi-(- 1 +) 
83 47 


a=ey+hez—eg 
tione on la baso (10) la fila de coordenadas 


Por esto, el vector 


3-1 6 
lai, az, ai) =(1, 4, -»(- 1 -4 ) (83, 6, —27), 
8-3 17 


o sea, 
ass — 430; + e4 — 2Te;. 
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Ya nos encontramos en el cap. 3 con el concepto de transforma- 
ción lineal de las indeterminadas. El concepto que se va a introducir 
ahora lleva el mismo nombre, pero tiene diferente carácter. Ahora 
bien, se pueden indicar ciertas relaciones entre estos dos conceptos 
homónimos. 

Sea dado un espacio lineal real de z dimensiones, que lo designa- 
remos con V,. Examinemos una transformación de este espacio, 
o sea, una correspondencia que asocia a cada vector a del espacio V, 
cierto vector a” de este mismo espacio. El vector a” se llama imagen 
del vector a en la transformación considerada. 

Si la transformación se designa con p, convendremos en designar 
la imagen del vector a con ag y no con q (a) o pa, como es usual para 
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el lector. Por lo tanto 
a' =ap. 
Una transformación p del espacio lineal V, se denomina trans- 


formación lineal de este espacio, si ésta transforma la suma de dos 
vectores cualesquiera a, b en la suma de las imágenes de estos vec- 


tores, 
(a+b) p=ap + bp, a) 


y el producto de cualquier vector a por cualquier número a, en el pro- 
ducto de la imagen del vector a por este mismo número &, 
(xa) p =a (ap). 2) 
De esta definición resulta inmediatamente que la transformación 
lineal del espacio lineal transforma cualquier combinación lineal de 
los vectores dados a1, as, . .., a, en la combinación lineal (con los 
mismos coeficientes) de las imágenes de estos vectores: 


(001 + aaa +.. + Anan) Q= a1 (a19) + ta (aaf) + + ++ + An (ar). (3) 


Demostremos la siguiente afirmación: 
Para cualquier transformación lineal «p del espacio lineal Vp, 
el vector nulo O se mantiene inmóvil, 


04=0, 


y la imagen del vector opuesto al vector dado a, es el vector opuesto 
a la imagen del vector a, 


En efecto, si b es un vector arbitrario, en virtud de (2), se tiene 
0p=(0-b) y =0-(bp)=0. 
Por otra parte, 
(2) 4=1(1) alp =(—1) (aq) = — aq. 

El concepto de transformación lineal de un espacio lineal surgió 
como una generalización -de la transformación afín del plano o del 
espacio de tres dimensiones, tratada en el curso de geometría analí- 
tica; en efecto, las condiciones (1) y (2) para las transformaciones 
afines se cumplen. Estas condiciones también se cumplen para Jas 
proyecciones de los vectores en el plano o para las proyecciones so- 
bre una recta (o sobre un plano) en el espacio de tres dimensiones. Por 
lo tanto, en el espacio lineal de dos dimensiones, de vectores- 
segmentos que parten del origen de coordenadas en el plano, la trans- 
formación de cualquier vector en su proyección sobre un eje que pase 
por el origen de coordenadas, es una transformación lineal. 
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Son ejemplos de transformaciones lineales en un espacio arbitra- 
rio V,, la transformación idéntica e, que mantiene a cada vector a 
en su sitio, 

ae=a, 


y la transformación nula œ, que transforma cualquier vector a en 
el vector nulo, 
aw=0. 


Estudiemos ahora todas las transformaciones lineales del 
espacio Vn. Sea 


en (4) 


una base de este espacio; igual que antes, la base (4), colocada en 
columna, so designará con e. Como cualquier vector a del espacio Va 
se representa univocamente en forma de una combinación lineal de 
los vectores de la base (4), la imagen del vector a, en virtud de (3), 
se expresa mediante las imágenes de los vectores (4) con los mismos 
coeficientes. En otras palabras, toda transformación lineal q del 
espacio V, se determina univocamente por las imágenes esp, e 
+=, en de todos los vectores de una base (4) fijada. 
Cualquiera que sea el sistema de n vectores ordenados 


¿Cto Direne Cms (5) 


en en n 


del espacio Vn, existe una transformación lineal de este espacio y 
sólo una, tal que el sistema (5) es el sistema de imágenes de los vectores 
de la base (4) en esta transformación, 


epen imi, 2, oos, ne (6) 
La unicidad de la transformación q se demostró anteriormente 
y sólo queda por demostrar su existencia, Determinemos una trans- 
isrmación q del modo siguiente: si a es un vector arbitrario del 
espacio y 
a= Y oe; 
i 


es su expresión en la base (4), supondremos que 


Y uci (7) 


ay 


Demostremos que esta fransformación es eal. Si 


b= Š Pie; 
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es cualquier otro vector del espacio, se tiene 


atoe |$ (+ Boe] a= È (th): 


= Y oci + Y pies = ap > bẹ- 
& i 


Si y es un número cualquiera, entonces 


0912 0090] y X (vae: = p arc (09). 


En lo que se refiere a la igualdad (6), ésta se cumple debido a la 
definición (7) de la transformación q, puesto que todas la coordenadas 
del vector e, en la base (4) son iguales a cero, excepto la ¿ésima coor- 
denada, que es igual a la unidad. 

Por consiguiente, hemos establecido una correspondencia biuni- 
voca entre todas las transformaciones del espacio lineal V, y todos los 
sistemas ordenados (5) formados por n vectores de este espacio. 

Sin embargo, todo vector c; posee una determinada expresión 
en la base (4), 


om (8) 


e Qie ii, 


Con las coordenadas del vector c; en la base (4) so puede formar 
una matriz cuadrada 


A = (015) (9) 
tomando por ¿-ósima fila la fila de coordenadas del vector cj, i = 
= 1, 2,..., n. Como eł'sistema (5) es arbitrario, la matriz A 


una matriz cuadrada arbitraria de orden z con elementos reales. 

Por lo tanto, resulta una correspondencia biunivoca entre todas 
las transformaciones lineales del espacio V, y todas las matrices cua- 
dradas de orden n; por supuesto, esta correspondencia depende de la 
elección de la base (4). 

Se dice que la matriz A determina la transformación lineal 
en la base (4), o, abreviadamente, que A es la matriz de la transfor- 
mación lineal ọ en la base (4). Si designamos con eq la columna for- 
mada por las imágenes de los vectores de la base (4), entonces, de 
(6), (8) y (9) se deduce la siguiente igualdad matricial, que describe 
totalmente la relación existente entre la transformación lineal p, 
la base e y la matriz A que determina esta transformación lineal en 


esta base: 
ep = (10) 


He aquí cómo se hallan las coordenadas de la imagen aq del 
vector a en la base (4), conociendo las coordenadas del mismo vector 


se 
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a en la misma base y la matriz A de la transformación lineal q. Si 


se tiene 
ap =2 a (emp), 


lo que es equivalente a la igualdad matricial 

ag = (Ay, Az --- An) (ep). 
Aplicando (10) y teniendo en cuenta que la multiplicación de las 
matrices es asociativa también cuando una de Jas matrices es una 
columna formada por vectores (lo cual fácilmente se comprueba), 
resulta: 

ap (As Az -s An) Ale. 


De aquí se deduce que la fila de coordenadas del vector ap es igual 
a la fila de coordenadas del vector a, multiplicada a la derecha por 
la matriz A de la transformación lineal, todo efectuado en la base (4). 


Ejemplo, Supongamos quo on la baso er, es. ea del espacio lineal de tros 
dimensiones, la transformación lineal so da mediante la matriz 


si 


entonces 


o sea, 


Relación entre las matrices de una transformación lineal en diver- 
sas bases, Naturalmente, la matriz que determina la transformación 
lineal depende de la elección de la base. Hallemos la relación entre 
las matrices que determinan una misma transformación lineal pero 
en bases diferentes. 

Sean dadas las bases e y e* con la matriz de cambio 7, 

e =Te, (14) 


y supongamos que la transformación lineal ọ se determina on estas 
bases por las matrices A y A’, respectivamente, 


e=4e, ea=48. (12) 


202 Cap. VII. Espacios lineales 


En virtud de (14), la segunda de las igualdades (12) da lugar a la 
igualdad 


(Te)y=4 (Te). 


Pero 


(Te) =7 (ep). 
En efecto, Si (Ti Tig -+s Tin) es la résima fila de la 
matriz 7, se tiene 
(Tiner Uzet » + « + Tinn) G = Tis (0441) Tiz (6af) + « « « + Tin (Cn). 
Por lo tanto, en virtud de (12), 
(2e)4=7 (09) =T (4e)=(1A)e, 
A'(Te)=(4'T)c, 


O sea, 


(TA)Je=(4'T)e. 


Si al menos para un i, 4< ¿< n, la ¿ósima fila de la matriz TA 
fuese diferente de la ¿-ésima fila de la matriz A'7, entonces sos 
distintas combinaciones lineales de los vectores ti, ez . 
resultarían iguales entre sí, lo cual es absurdo, puesto que la ios 
e es linealmente independiente. Por lo tanto, 


TA=A'T, 
y como la matriz de cambio 7 no es degenerada, de aquí resulta 
que 
A=TATO, A=1N 7, (43) 
Dos matrices, B y C, se llaman semejantes, si están ligadas 
por la igualdad 
C= GBQ, 


donde Q es una matriz no degenerada. En este caso, se dice que la 
matriz C es la transformada de la matriz B por la matriz Q. 

Por lo tanto, las igualdades (13) demostradas anteriormente 
se pueden enunciar on forma del siguiente importante teorema: 

Las matrices que determinan una misma transformación lineal 
en diferentes bases, son semejantes entre sí. Además, la matriz de la 
transformación lineal q en la base e' se obtiene transformando la 
matriz de esta transformación en la base e por la matriz de cambio 
de la base e' a la base e. 

Subrayemos que, si la matriz A determina la transformación q 
en la base e, cualquier matriz B semejante a la matriz A, 


B=Q"40, 


también determina la transformación q en cierta base, precisamente, 
en la base que se obtiene de la base e mediante la matriz de cambio Q, 
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Operaciones con las transformaciones lineales. Como ya se demos- 
tró, asociando a cada transformación lineal del espacio V, su matriz 
en una base fija, resulta una correspondencia biunívoca entre todas 
las transformaciones lineales y todas las matrices cuadradas de 
orden n. Es natural esperar que a las operaciones de adición y multi- 
plicación de las matrices, y también a la multiplicación de una matriz 
por un número, les correspondan unas operaciones análogas con las 
transformaciones lineales. 

Sean dadas en el espacio V, las transformaciones Y y p. Llamemos 
suma de estas translormaciones a la transformación «q + p, deter- 
minada por la igualdad 

a(9+ Y) =aq + ap; (14) 
por consiguiente, ésta transforma cualquier vector a en la suma de sus 
imágenes en las transformaciones y y Y. 

La transformación q -+ y es lineal. En efecto, para cualesquiera 

vectores a y b y cualquier número æ, 


(64094 Y) =(0+ 0) p+(0+b)y= 
=a +bp ap bp =a (9 + p)+0(0 +); 
(aa) (p +p) = (xa) q + (xa) p= a (ap) + a (ap) = 
=a (ap + ap) =a fa (+ p) 


Por otra parte, llamemos producto de las transformaciones linea- 
les ọ y p a la transformación qp determinada por Ja igualdad 


a (ey) = (aq) p, (45) 
es decir, que se obtiene como resultado de la realización sucesiva 


de las transformaciones p y %. 
La transformación qp es lineal: 


(a+b) (op) =1la +0) 9] y= (ap +4) y= 
= (aq) p+ (bpp = a (P4) + b (P4); 
(aa) (pp) = [(2a) p] p = la (ap) Y= a [(aq) p) = a la (41). 


Finalmente, llamemos producto de la transformación lineal y por 
el número » a la transformación » determinada por la igualdad 


a (xq) =x (ap); (16) 


de aquí que en la transformación q las imágenes de todos los vectores 
se multiplican por el número x. 
La transjormación xq es lineal: 


(a +b) (xg) =x [la + b) ql =x (09 + bg) = 
= x (ag) +% (bẹ) =a (o) +b (24); 
(ua) (xq) = x [(2a) p] = 7 [a (aq)] =a [x (aq)] =0 la (xa) 
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+ =, €n, las transformaciones q 
A = (as) y B = (fis), respecti- 


Supongamos que en la base es, 
y y se determinan por las matrice 
vamente, 


eq 
Entonces, en virtud de (14), 


le, eẸ= Be. 


e) ee X aert X Bues Y latu) en 
£ £ £ 
o sea 


e+ H= (AtB) e. 


Por lo tanto, la matriz de la suma de transformaciones lineales en 
cualquier base es igual a la suma de las matrices de estas transforma- 
ciones en esta misma. base. 

Por otra parte, en virtud de (15), 


o sea, 


ely) = (4B) e. 


En otras palabras, la matriz del producto de transformaciones lineales 
en cualquer base es igual al producto de las matrices de estas transfor- 
maciones en la misma base. 

Finalmente, en virtud de (16), 
> 
A 


e (04) = x (eip) 2% 2 Giyej= (xai) ez, 
f 
o soa, 
el(xq)=(x4}e. 


Por consiguiente, la matriz que determina en cierta base el producto 
de la transformación lineal p por el número x, es igual al producto 
de la matriz de la misma transformación q en esta base por el nú- 
mero Y. 

De los resultados obtenidos se deduce que las operaciones con 
las transformaciones lineales poseen las mismas propiedades que las 
operaciones con las matrices. Así, pues, la suma de transformaciones 
lineales es conmutativa y asociativa, y el producto es asociativo, aun- 
que para z > 1 no es conmutativo. Para las transformaciones linea- 
Jes existe la resta unívoca. Obsérvese también que entre las trans- 
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formaciones lineales, la transformación idéntica e desempeña el papel 
de la unidad, y la transformación nula œ, el papel del cero. En efecto, 
en cualquier base, la transformación e se determina por la matriz 
unidad, y la transformación œ, por la matriz nula. 
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Un subconjunto L del espacio lineal V se llama subespacio lineal 
de este espacio, si él mismo es un espacio lineal con respecto a las 
operaciones de suma de vectores y de multiplicación de un vector por 
un número, determinadas en V. Así, pues, en el espacio euclídeo 
de tres dimensiones, el conjunto de vectores que parten del origen 
de coordenadas y que están situados en un plano (o en una recta) 
que pasa por el origen, es un subespacio lineal. 

Para que un subconjunto no vacio L del espacio V sea un subes- 
pacio lineal de éste, es suficiente que se cumplan las condiciones 
siguientes: 

1. Si los vectores a y b pertenecen a L, el vector a + b también 
pertenece a L. 

2. Si el vector a pertenece a L, el vector aa también pertenece a L 
para cualquier valor del número «. 

En efecto, en virtud de la condición 2, el conjunto Æ contiene 
el vector nulo, pues, si el vector a pertenece a L, el vector 0-a = O 
también pertenece a L. Luego, junto con cada uno de sus vectores a, 
y otra vez en virtud de la condición 2, el vector opuesto —a 
(1) :a también pertenece a L, por lo cual, debido a la condi- 
ción 1, también pertenece a L la diferencia de dos vectores cuales- 
quiera de £. En lo que se refiere a las demás condiciones incluidas 
en la definición del espacio lineal, cumpliéndose éstas en V, tam- 
bión se cumplen en £. 

Pueden servir de ejemplos de subespacios lineales del espacio V, 
el mismo espacio V, así como el conjunto compuesto del solo vector 
nulo, denominado subespacio nulo. De mayor interés es el siguiente: 
tomemos en el espacio V cualquier sistema finito de vectores 


Ay, am sr (1) 
y designemos con £ el conjunto de todos los vectores que son combi 
naciónes lineales de los vectores (1). Demostremos que L es un subes- 
pacio lineal. En efecto, si 


b= aa,- ga ho... tp, C= Biag + Bar 


E Brân, 
se tiene 


b+e 


A + Ba) as + (0 


Badaz-H + (ar H Br) ar 
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o sea, el vector b+c pertenece a L; también pertenece a L el 
vector 


yb =(yas) as + (y22) az ++ (Yar) ar 


para cualquier número y. 

Suele decirse que este subespacio lineal L está engendrado por 
el sistema de vectores (1); en particular, los mismos vectores (1) 
pertenecen a L. 

Por cierto, todo subespacio lineal de un espacio lineal de dimensión 
finita se engendra por un sistema finito de vectores, ya que, si el subes- 
pacio no es el nulo, posee incluso una base finita. La dimensión del 
subespacio lineal L'no es mayor que la dimensión n del mismo espacio 
Va, siendo igual a n solamente cuando Z = V,. Evidentemente, 
la dimensión del subespacio nulo se debe tomar igual a cero. 

Para cualquier k, O < k < n, en el espacio Vp existen subespacios 
lineales de dimensión k; para esto, es suficiente considerar el subespacio 
engendrado por cualquier sistema de 4 vectores linealmente indepen- 
dientes. 

Supongamos que en el espacio V se han dado los subespacios 
lineales L, y La. Como fácilmente se comprueba, el conjunto de 
vectores Ly que pertenecen simultáneamente a L; y a Lo, es un subes- 
pacio lineal; éste se llama intersección de los subespacios L, y Lo. 
Por otra parte, también es un subespacio lineal la suma Z do los 
subespacios Ly y La, o sea, el conjunto de todos los vectores de V que 
se representan en forma de una suma de dos vectores, uno de los 
cuales pertenece a L4 y el otro, a La. Si dı, da, de y d son las dimen- 
siones respectivas de los subespacios Ly, La, Lo y E, se cumple la 
igualdad: 


d=di+d:—do (2) 
es decir, la dimensión de la suma de dos subespacios es igual a la suma 
de las dimensiones de estos subespacios menos la dimensión de su 
intersección. 

Para la demostración, se toma una base arbitraria 


Qis aas <. os Gdo (3) 
“del subespacio Lo y se completa hasta que se forme una base 
Gys azs o- -y Gdor baotts -+ -s bar (4 


del subespacio L,y y hasta que se forme una base 

e IR 6) 
del subespacio Zs. Aplicando la definición del subespacio L, se 
observa sin dificultad que éste se engendra por el sistema de 
vectores 


Ap ar + Ados bdoti» ++ +1 Dar Cdott» +=.» Caor (6) 
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Por consiguiente, la fórmula (2) quedará demostrada si se demuestra 
que el sistema (6) es linealmente independiente. 
Supongamos que se cumple la igualdad 


+ Barbas + 
+ Vasóda 0 


Qiy + pam» - + H ao -i Bdot 1bao+1 


HYaottCaoh H- 
con ciertos coeficientes numéricos. Entonces, 
d= aty + Atat - - . -+ Aala + Baottbaoti +- -+ Barba, = 
— Vio p1Cdo +1 — == + — Vasa (7) 


El primer miembro de esta igualdad pertenece a L4, el segundo, a La. 
Por consiguiente, el vector d, que es igual tanto al primer miembro 
como al segundo miembro de esta igualdad, pertenece a Lo, por lo 
cual se expresa linealmente mediante la base (3). Sin embargo, el 
segundo miembro de la igualdad (7) muestra que el vector d también 
se expresa linealmente mediante los vectores C4y+1, - > <> Cay Como 
lema (5) es linealmente independiente, resulta que todos los 
iguales a cero, es decir, d = 0, y por 
lo tanto, como el sistema (4) es linealmente independiente, también 
son iguales a cero todos los coeficientes %;, ..., ap Batt +. 
Pa. Con esto, queda demostrada la independencia lineal del siste 
ma (6). 

recomienda al lector comprobar que nuestra demostración es 
ida también para el caso en que el subespacio Lo sea nulo, o sea, 

0. 

Campo de valores y núcleo de una transformación lineal. Supon- 
gamos que en el espacio lineal V, es dada una transformación lineal q. 
De las definiciones de subespacio lineal y de tranformación lineal 
so deduce inmediatamente que si / es un subespacio lineal cualquiera 
del espacio Vn, el conjunto Lg de las imágenes de todos los vectores 
de L en la transforma: Ņ también es un subespacio lineal; en 
particular, el conjunto V, « de las imágenes de todos los vectores 
del espacio V, es también un subespacio lineal; este conjunto se 
llama campo de valores de la transformación q. 

Hallemos la dimensión del campo de valores. P: sto, obsér- 
vese que, como todas las matrices que determinan la transformación q 
en diferentes bases son semejantes entre sí, todas ellas tienen un mismo 
rango en virtud del último teorema del $ 14, Por consiguiente, este 
número puede recibir el nombre de rango de la transformación 
lineal q. 

La dimensión del campo de valores de una transformación lineal 
Q es igual al rango de esta última. 
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En efecto, supongamos que (y se determina en la base e, 
€ -> «+ €n por la matriz A. El subespacio Vap se engendra por los 
vectores 

EPs EPs aens nG 6) 
y, en particular, cualquier subsistema linealmente independiente, 
maximal del sistema (8) será base del subespacio Y. Pero, el maximo 
número de vectores linealmente independientes del sistema (8) es 
igual al máximo número de filas linealmente independientes de la 
matriz A, es decir, es igual al rango de esta matriz. EJ teorema queda 
demostrado, 

Ya sabemos que en una tra 


ción lineal «p, el vector nulo 
se transforma en sí mismo. El conjunto N (q) de todos los vectores 
del espacio Vn que se transforman en el vector nulo en la trans- 
formación p, ho es, pues, vacío, y es, evidentemente, un subi 
lineal, Este subespacio se denomina miúcico de la transforma 
y su dimensión lleva el nombre de defecto de la misma. 

Para cualquier transformación lineal y del espacio Vn, la suma 
del rango y del defecto de la misma es igual a la dimensión n de todo 
el espacio. 

En electo, si r os el rango de la transformación q, el subespacio 
Vap posee una base de r vectores 


üy, âp >or Oro 9) 
En el espacio V, se pueden elegir tales vectores 
bas ba, aaar Dr, (10) 


que 


bip 1, 2,. E 
evidontomente, la elección de los vectores (10) no es única. Si alguna 
combinación lineal no trivial de los vectores (10) se transformase 
en cero y, en particular, si los vectores (10) fuesen linealmente depen- 
dientes, los vectores (9) también resultarían linealmente dependientes, 
en contra de la suposición. Por esto, el subespacio lineal Z engendrado 
por los vectores (10), tiene la dimensión r, y su intersección con el 
subespacio W (q) es igual a cero, 

Por otra parte, la suma de los subespacios L y N (q) coincide con 
todo el espacio V,. En efecto, siendo c cualquier vector del espacio, 
el vector d = cp pertenece, naturalmente, al subespacio V,p. Enton- 
ces, existe en el subespacio L un vector b tal que 


bp=d; 


el vector b se expresa mediante el sistema (10) con los mismos coefi- 
cientes con que se expresa el vector d mediante la base (9). Por con- 


siguiente 
c=b+ (cb). 


o 
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donde el vector c—b pertenece al subespacio N (q), puesto que 
(c—b)p=cp—by =d—d=0. 

La afirmación del teorema se deduce de los resultados obtenidos 
y de la fórmula (2). 

Transformaciones lineales no degeneradas. Una transformación 
lineal ọ del espacio lineal Y, se llama no degenerada, si se satisface 
cualquiera de las condiciones siguientes, cuya equivalencia es con- 
secuencia inmediata de los teoremas demostrados anteriormente: 

1. El rango de la transformación q es igual a n. 

. El campo de valores de la transformación q es todo el espacio Vn. 

3. El defecto de la transformación q es igual a cero. 

Para las transformaciones lineales no degeneradas se pueden dar 
también muchas otras definiciones equivalentes a las señaladas y, 
en particular, las definiciones 4—6 que siguen, 

4. Diferentes vectores del espacio V, tienen en la transformación q 
diferentes imágenes. 

En efecto, si la transformación Ų posee la propiedad 4, el núcleo 
de esta transformación consta solamente del vector nulo, o sea, se 
cumple también la condición 3. Si los vectores a y b son tales que 
ab, pero aq = bp, se tiene a— b0, pero (a— b) p = 0, 
es decir, no se cumple la condición 3. 

De 2 y 4 se deduc 

5. La transformación p es una correspondencia biunívoca del 
espacio Vn sobre todo este espacio. 

De 5 se deduce que, para una transformación lineal y no degene- 
rada, existe la transformación inversa y" que transforma cada vector 
ap en el vector a, 


(ap) =a. 
La transformación q” es lineal, puesto que 
(aq +09) gi =1(a+0) 9 lg =0 +0, 


[a (ap)] q”? = (xa) p] 
De la definición de la transformación «q”*, se deduce que 
i=9p=e (14) 


las mismas igualdades (11) se pueden considerar como la definición 
de la transformación inversa. De aquí y de los últimos resultados 
del párrafo anterior, se deduce que si una transformación lineal y 
no degenerada se determina en cierta base por la matriz A, que no es 
degenerada en virtud de la propiedad 4, entonces la transformación 
«"! se determina en esta base por la matriz A“. 

Por lo tanto, llegamos a la siguiente definición de transformación 
lineal no degenerada: 

6. Para la translormación ọ existe la transformación lineal 
inversa q 
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$ 33. Raíces características y valores propios 
Sea A = (œ) una matriz cuadrada de orden n con elemento: 
reales, Sea, por otra parte, 7 una indeterminada, Entonces la matri: 
A—hE, donde E es la matriz unidad de orden z, se llama matriz 
característica de Ja matriz A. Como en la diagonal principal de la 
matriz AE, figura A, siendo iguales a cero todos los demás elementos, 
resulta 


Uy —A Wa. Can 


a [1 e 


Qn 


El determinante de la matriz A—}E es un polinomio en 2, de 
orden n. En efecto, el producto de los elementos que figuran en la 
diagonal principal es un polinomio en 2 con el término superior 
(—1)"A", Todos los demás términos del determinante no contiene 
al menos dos de los elementos que figuran en la diagonal principal, 
por lo que su grado respecto a % no es mayor que n — 2. Los cocfi- 
cientes de este polinomio se podrían hallar fácilmente. Así, pues, 
el coeficiente de 7"=1 es igual a (—1) (ay = oo Lem) 
y el término independiente coincido con el determinante de la 
matriz A. 

El polinomio de n-ésimo grado | A — hE | se Mama polinomio 
característico de la matriz A, y sus raíces, que pueden ser tanto reales 
como imaginarias, se llaman raíces características de la misma. 

Las matrices semejantes poseen iguales polinomios característicos 
Yy, por consiguiente, iguales raíces caracteristicas, 

En efecto, supongamos que 


B=Q%A0. 
Entonces, teniendo en cuenta que la matriz ÀE es conmutable con 
la matriz Q y que |Q*]=|Q|”, resulta: 
[B=1£|=|Q%4Q—1AE|=|0*(4A—A2)Q|= 

IQM- A=AE[[QO[=|A—AE |, 

que es lo que se quería demostrar. 

En virtud del teorema demostrado en el $ 31 sobre la relación 
entre las matrices que determinan una transformación lineal en 
diferentes bases, se deduce que a pesar de que la transformación 
lineal q se puede determinar por diferentes matrices en bases diversas, 
sin embargo, estas matrices tienen un mismo conjunto de raíces carac- 
terísticas. Por consiguiente, estas raíces se pueden llamar raíces 
características de la misma transformación p. Todo el conjunto de 
estas raíces características, tomando cada raíz con el mismo orden 
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de multiplicidad que tiene en el polinomio característico, se llama 
espectro de la transformación lineal q. 

Las raíces características desempeñan un gran papel en el estudio 
de las transformaciones lineales. El lector tendrá muchas oportu- 
nidades para convencerse de esto. Por ahora, indicaremos una de las 
aplicaciones de Jas raíces características. 

Supongamos que en el espacio lineal real V,, se ha dado una trans- 
formación lineal q. Si en este caso el vector b, diferente de cero, 
se transforma en otro que es proporcional al mismo vector b, 

bp =2wb, (1) 
donde A, es cierto número real, el vector b se Mama vector propio 
de la transformación p y el número Ay, valor propio de la misma; 
además, se dice que el vector propio b corresponde al valor propio ho. 

Obsérvese que como b + 0, el número A, que satisface a la con- 
dición (1) se determina para el vector b unívocamente. Subrayemos 
luego que el vector nulo no se considera vector propio de la transforma- 
ción q, a pesar de que satisface a la condición (1) para cual- 
quier Ao. 

La rotación del plano euclideo alrededor del origen de coorde- 
nadas, en un ángulo que no sea múltiplo de x es un ejemplo de trans- 
formación lineal que carece de vectores propios. Otro ejemplo de caso 
extremo es la dilatación del plano; aquí todos los vectores que parten 
del origen de coordenadas se alargan, aumentando de longitud por 
ejemplo, cinco veces. Para esta transformación lineal, son propios 
todos los vectores no nulos del plano; todos ellos corresponden al 
valor propio 5. 

Las raíces características reales de la transformación lineal q, 
(si es que éstas existen), y sólo éstas, son valores propios de la misma. 

En efecto, supongamos que en la base es, es, » - -; Cn, la trans- 
formación q tiene la matriz A = (ay) y sea 


un vector propio de la t 


Como se ha demostrado en el $ 31, 


bp = (Pr Pas -- 
Las igualdades (2) y (3) dan lugar al 


Pitre + Batar + Prans 
Bitia Beso 00 Bana Ma day 


Bn) Ae. (o) 
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Como b0, no todos los números B, fa, .-., Bn son iguales a 
cero. Por lo tanto, en virtud de (4), el sistema de ecuaciones 
lineales homogéneas 


(1 — Ao) 21 H antat + H 


At, + (atz 


(5) 


Can Ti apa + «4 (Enn — a) Ln = O 
posee solución no nula; de donde su determinante es igual a coro, 


Cu—d Aa, On 


yas 


DE t © 


E S 


Transponiendo, resulta 
lA—ME|=0, (7) 


osea, el valor propio Žo es, en efecto, raíz característica de la matriz A 
y, por consiguiente, de la transformación «q; naturalmente, éste 
es real, 

Recíprocamente, supongamos que Ào es una raíz característica 
real cualquiera de la transformación q y, por consiguiente, de la 
matriz A. Entonces, se cumple la igualdad (7) y, por lo tanto, 
también la igualdad (6) obtenida de la (7) por transposición. De aquí 
se deduce que el sistema de ecuaciones lineales homogéneas (5) 
posce solución no nula, e incluso real, puesto que todos los coefi- 
cientos de este sistema son reales, Indícando esta solución mediante 


(Bs, Par. Bn)» (8) 


so verifican las igualdades (4). Designemos con b el vector del espo- 
cio Y, que tiene la fila de coordenadas (8) en la base e4, ez, . 

está claro que b O. Entonces, se verifica la igualdad (3), y de a 
y (3) se deduce (2). Por lo tanto, resulta que b es un vector propio 
de la transformación q, correspondiente al valor propio Ay. El teo- 
rema queda demostrado. 

Obsérvese que si se examinase un espacio lineal complejo, no 
habría necesidad de que la raiz característica fuese real, o sea, 
quedaría demostrado el teorema siguiente: las raíces características 
de una transformación lineal del espacio lineal complejo, y sólo ellas, 
son. valores propios de esta transformación, De aquí se deduce que 
toda transformación lineal posee vectores propios en el espacio lineal 
complejo. 
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Volviendo al caso real considerado, señalemos que el conjunto 
de los vectores propios de la transformación lineal q que correspon- 
den al valor propio Ao, coincide con el conjunto de soluciones reales 
no nulas del sistema de ecuaciones lineales homogéneas (5). De aquí 
se deduce que el conjunto de vectores propios de la transformación 
lineal ọ, correspondientes al valor propio do, después de agregarle el 
vector nulo, es un subespacio lineal del espacio V,. En efecto, de lo 
demostrado en el $ 12 se deduce que el conjunto de las soluciones 
(reales) de cualquier sistema de ecuaciones lineales homogéneas con n 
incógnitas es un subespacio lineal del espacio Vp. 

Transformaciones lineales con espectro simple. En muchos casos 
se necesita saber si una transformación lineal dada q puedo tener 
en cierta base una matriz diagonal. En realidad, no cualquier trans- 
formación lineal se puede determinar por una matriz diagonal. 
En el $ 61 se indicarán las condiciones necesarias y suficientes para 
esto; ahora queremos exponer una condición suficiente. 

Demostremos primero las siguientes proposiciones auxiliares: 

Una transformación lineal q se determina en la base es, ez, .. 3 Cn 
por una matriz diagonal cuando, y sólo cuando, todos los vectores de 
esta base son vectores propios de la transformación «. 

En efecto, la igualdad 


ep=hke 


oquivale a que en la ¿ésima fila de la matriz que determina la trans 
formación lineal en la base indicada, sean iguales a cero todos los 
elementos que estón fuera de la diagonal principal, y que en la 
diagonal principal (o sea, en el iésimo lugar) figure el número A. 

Los vectores propios bi, bz, . .., ba de la transformación lineal y 
que corresponden a diferentes valores propios, forman un sistema lineal- 
mente independiente. 

Demostraremos esta afirmación por el mótodo de inducción so- 
bro k, puesto que para Æ = 1 se cumple: un vector propio, diferen- 
te de cero, forma un sistema linealmente independiente. Suponga- 
mos que 


Mp=kmbpy i=1, 2, ..., k, 


donde 
Mhs para ¿4 jo 


Si existiese una dependencia lineal 
aba + abr. -+ arba =0, (9) 


donde, por ejemplo, æ, 0, entonces aplicando a ambos miembros 
de la igualdad (9) la transformación «q, obtendríamos 


adibi azaba +. - - + 2d ba = 0. 
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Restando de aquí la igualdad (9) multiplicada por A+, resultaría 
Cts (As — An) Da + 2 (da — Aa) bot «+ + lo Ana ns — Aa) br- =0, 


lo que da una dependencia lineal no trivial entre los vectores 
bis bas . -., bai, pues 0% (A; — Ax) $ 0. 

Se dice que una transformación lineal q del espacio lineal real 
V, tiene un espectro simple, si todas sus raíces características son 
reales y distintas. Por consiguiente, la transformación ọ tiene n 
valores propios distintos, de aquí que, en virtud del teorema demos- 
trado, en el espacio V, existe una base compuesta de vectores propios 
de esta transformación. Por lo tanto, toda transformación lineal con 
espectro simple puede determinarse por una matriz diagonal. 

Pasando de la transformación lineal a las matrices que Ja deter- 
minan, obtenemos el resultado siguiente: 

Toda matriz cuyas raíces características son reales y distintas, es 
semejante a una matriz diagonal o, como suele decirse, se reduce a la 
forma diagonal. 


CAPITULO VII 
ESPACIOS EUCLIDEOS 


$ 34. Definición del espacio euclídeo. Bases ortonormales 


El concepto de espacio lineal de n dimensiones no generaliza 
en gran medida el concepto de plano euclídeo o de espacio euclídeo 
de tres dimensiones, pues, en el caso de n dimensiones, para n > 3 
no está definida ni la longitud de un vector, ni el ángulo entre los 
vectores, resultando imposible el desarrollo de la rica teoría geo- 
métrica, que conoce bien el lector para n = 2 y n = 3. Sin embargo 
la situación tiene salida del modo siguiente. 

Por el curso de geometría analítica se sabe que en el plano y en 
el espacio de tres dimensiones se puede introducir el concepto de 
producto escalar de vectores. Este se define mediante la longitud de 
los vectores y el ángulo formado por ellos. No obstante, resulta que la 
longitud del vector y el ángulo formado por los vectores se pueden 
expresar a su vez mediante los productos escalares. Por esto, defi- 
niremos axiomáticamente el producto escalar en cualquier espacio 
lineal de n dimensiones mediante algunas propiedades bien conoci- 
das del producto escalar de vectores en el plano o en el espacio de 
tres dimensiones. Además, teniendo en cuenta los objetivos inmedia- 
tos, debido a los cuales fue introducido este apartado en el curso de 
álgebra superior, aquí no se dará la definición de longitud de un vector 
y de ángulo entre los vectores. Al lector que le interese la construc- 
ción de la geometría en el espacio de n dimensiones le recomendamos 
que consulte literatura más especializada; en primer lugar, la del 
álgebra lineal. 

En este capítulo, a excepción del final del presente párrafo, 
se examinan siempre los espacios lineales reales. 

Diremos que en el espacio lineal real V, de n dimensiones está 
dofinido el producto escalar, si a cada par de vectores a, b se ha puesto 
en correspondencia un número real, designado por Ja notación (a, b) 
y denominado producto escalar de los vectores a y b, cumpliéndose 
las condiciones siguientes (aquí, a, b, c son vectores arbitrarios del 
espacio V,, œ es un número real cualquiera): 


I. (a, b) = (b, a). 
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w 
H 


IV. Si a0, el cuadrado escalar del vector a es estrictamente 
positivo, 


(a, a)>0. 

De II, para «=0 se deduce la igualdad 
(0, b)=0, a) 
o sea, el producto escalar del vector nulo por cualquier vector b es igual 


a cero; en particular, es igual a cero el cuadrado escalar del vector 
nulo. 

De II y II, se obtiene inmediatamente la siguiente fórmula 
para el producto escalar de las combinaciones lineales de dos sistemas 
de vectores: 


x i a 
(È aan Y Bb) = 2 bs (an 0). (0) 


Si en el espacio lineal de n dimensiones está definido el producto 
escalar, éste se llama espacio cuclídeo de n dimensiones. 

Para cualquier n, se puede definir el producto escalar en el espacio 
lineal V, de n dimensiones, o sea, este espacio se puede convertir en 
euclideo. 

En efecto, tomemos en el espacio V, cualquier base ey, €z, >= «+ én 


Si Ñ 
a= Šan b= Ñ pen 


(a, 0) = Y oupi (3) 


Fácilmente se comprueba que se cumplen las condi 
o, sen, que la igualdad (1) determina el producto escalar en el espa- 
cio Va. 

Vemos, pues, que generalmente, en el espacio lineal de n dimen- 
siones so puedo definir el producto escalar de muchos modos; natural- 
mente, la definición (3) depende de la elección de la base. Sin embar- 
go, no sabemos por ahora si el producto escalar se puede introducir 
de algún modo que de principio sea diferente. Nuestro próximo 
objetivo consiste en examinar todos los modos posibles de convertir 
el espacio lineal de n dimensiones en espacio euclideo y en establecer 
que, en cierto sentido, para cualquier n existe un solo espacio 
euclideo de n dimensiones. 
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Sea dado un espacio euclídeo arbitrario Æ, de n dimensiones, 
o sea, que en el espacio lineal de z dimensiones está definido arbi- 
trariamente el producto escalar. Se dice que los vectores a y b son 
ortogonales, si su producto escalar es igual a cero, 
(a, b)=0. 


De (1) se deduce que el vector nulo es ortogonal a cualquier vector; 
sin embargo, pueden existir también vectores ortogonales no nulos. 

Un sistema de vectores se denomina sistema ortogonal, si todos 
los vectores de este sistema son ortogonales entre sí dos a dos. 

Todo sistema ortogonal de vectores no nulos es linealmente inde- 
pendiente. 

En efecto, sea dado en £, un sistema de vectores ay, da, +. s, nr 
donde a; 0, i = 1, 2, .. n, k, y 


(an aj)=0 para ij. (4) 


Si 


ay -$ al -.. Harar = 0, 


multiplicando escalarmente ambos miembros de esta igualdad por el 
vector a 1<i<k, en virtud de (1), (2) y (4), resulta: 


O= (0, as) = (a0, -- dodo + - 2109 ai) = 
= Qy (41, 01) + Ar (az, 01) +... + On (An, i) =0 (ai, ai). 
112... 


De aquí, como (a;, a;) > O según IV, se tiene a; = 0, i 
+... k, como se quería demostrar. 

Ahora se va a describir el proceso de ortogonalización, o sea, un 
método para pasar de cualquier sistema de k vectores 


Ai, an «+, Uy (5) 


linealmente independiente, del espacio euclideo E, a un sistema 
ortogonal, compuesto también de Æ vectores no nulos; estos vectores 
so indicarán mediante by De, .... bre 

Hagamos ba, de modo que el primer vector del sistema (5) 
quedará incluido en el sistema ortogonal que se construye. Hagamos 
luego 

b= by + az 

Como b; = a, y los vectores a, y az son linealmente independientes, 
el vector bp será diferente de cero para cualquier número 0%. Elija- 
mos este número de modo que el vector b, sea ortogonal al vec- 
tor by: 


O= (bn, 6) = (br, tbi aa) = tts (by, bi) - 
de donde, en virtud de IV, 


(bs, az)» 


_ a 
r 


GA 


248 Cap. VIII. Espacios euclideos 


Supongamos que ya está construido el sistema ortogonal de 
vectores no nulos bj, bz, . .., bz; supongamos, además, que para 
cualquier i, 1<i<l, el vector b; es combinación lineal de los 
vectores a, az, . .., a. Entonces, esto mismo se cumplirá tam- 
bién para el vector 41, si éste se elige de la forma siguiente: 


bin = aby + aalr 


H abit ais 


En este caso, el vector by; será diferente de cero, puesto que el siste- 
ma (5) es linealmente independiente y el vector a; no está incluido 
entre los vectores by, ba, bi. Los coeficientes az, i = 1, 2, 

, Ese eligen de modo que “el Vector bzs; sea ortogonal a todos los 
hara bn i= 4, 2, k 


m= (bi, bias 


= (bis aht abad... -> abi -H ars) = 
= 01 (bi, bi) ta (bi, ba) o A e (br, BH (bas arri); 


de aquí, como los vectores by, ba, ..., bi son ortogonales entre sí, 
resulta 


2 (li, b)+ (ba, 01,1) =0 
o sen, 
bi ar.) 
ze ¡CTN pet 


Continuando este proceso se construye el sistema ortogonal 
buscado bj, De, a, bre 

Aplicando este proceso de ortogonalización a cualquier base del 
espacio E, se obtiene un sistema ortogonal de n vectores no nulos, 
es decir una base ortogonal, pues, por lo demostrado, este sistema es 
linealmente independiente. Recordando ahora la observación hecha 
con relación al primer paso del proceso de ortogonalización y tenien- 
do en cuenta también que cualquier vector no nulo se puede incluir 
en una base del espacio, se puede enunciar incluso la siguiente afir- 
mación: 

Todo espacio euclídeo posee bases ortogonales; cualquier vector 
no nulo de este espacio forma parte de alguna base ortogonal. 

En adelante, desempeñará un papel importante una forma espe- 
cial de base ortogonal; las bases de esta forma corresponden a los 
sistemas cartesianos rectangulares de coordenadas empleados en la 
geometría analítica. 

El vector b se llamará normal, si su cuadrado escalar es igual 
a la unidad, 


e «de 


(W, b=1. 
Si a0, de donde (a, a) >0, el paso al vector 
4 
Vi 


h= 


a 
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se denominará normalización del vector a. El vector b es normal, 
puesto que 
1 1 1 , 
b, b= = 4, 
rta dl) e n=1 


Una base es, ez, . . -, €n del espacio euclídeo E, se llama orto- 
si ésta es ortogonal y todos sus vectores son normales, es 


(ei, ej) =0 para ij, 
(en e)=1, 1,2, .5 7 


Todo. espacio euclideo posee bases ortonormales. 

Para la demostración es suficiente tomar cualquier base ortogo- 
nal y normalizar todos sus vectores. Con esto, la base se mantiene 
ortogonal, puesto que, para cualesquiera a y f, de (a, b) = 0, se 
deduce que 


(6) 


(aa, PI) =ap(a, b) =0. 

La base €, es, .. . ., €a del espacio euclideo E, es ortonormal si, 

y sólo si, el producto escalar de dos vectores cualesquiera del espacio es 

igual a la suma de los productos de las coordenadas correspondientes 
de estos vectores en la base indicada, o sea, si de 


a- ei b= PA Br (7) 
S A 
se deduce que 
(a, b) PA Be- (8) 


En efecto, si para nuestra base se verifican las igualdades (6), 
se tiene 


(0 b)= (D aen D pe) = Y Balen e= D upi 
aer = a a 
Recíprocamente, si nuestra base es tal, que para cualesquiera vecto- 
res a y b expresados en esta base en la forma (7) se cumple la igual- 
dad (8), entonces, tomando por a y b dos vectores cualesquiera de 
esta baso e, y ey, iguales o diferentes, las igualdades (6) se obtendrán 
de (8). 

Confrontando este resultado obtenido con la demostración ante- 
rior de la existencia de espacios euclídeos de z dimensiones para 
cualquier n, se puede enunciar la siguiente proposición: si en el 
espacio lineal de n dimensiones V, se ha elegido una base arbitraria, en 
Vn se puede definir el producto escalar de modo que en el espacio euclideo 
obtenido la base elegida sea una de las bases ortonormales. 
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Isomorfismo de los espacios euclídeos. Se dice que los espacios 
euclídeos E y E” son isomorfos, si entre los vectores de los mismos 
se puede establecer una correspondencia biunívoca tal, que se cum- 
plan las condiciones siguientes: 

1) esta correspondencia es una correspondencia de isomorfismo 
entre E y E”, considerados éstos como espacios lineales (véase el $ 29); 

2) en esta correspondencia se conserva el producto escalar; en 
otras palabras, si las imágenes de los vectores a y b de Æ son los vecto- 
res a' y b de E”, respectivamente, entonces 


(a, b)= (0, b). (9) 


De la condición 1) se deduce inmediatamente que los espacios 
euclídeos isomorfos tienen una misma dimensión. Demostremos la 
afirmación recíproca: 

Dos espacios euclídeos cualesquiera E y E' que tengan una dimensión 
n, son isomorfos entre sí. 

En efecto, elijamos en los espacios E y E” las bases ortonormales 


E ei it (10) 
y, respectivamente, 
o i aae Be (11) 
Poniendo en correspondencia a cada vector 
a= Y ae 
E 
do E el vector 
a = Y aei 
a 


de E", que tiene en la base (11) las mismas coordenadas que tiene el 
vector a en la base (10), se obtiene. evidentemente, una corresponden- 
cia de isomorfismo entre los espacios lineales E y Æ’. Demostremos 
que también se cumple la igualdad (9): si 


È Bien v= D) Biei, 


entonces, en virtud de (8) (téngase en cuenta que las bases (10) 
y (11) son ortonormales), 


(a, b= Y api = (a, 01). 
A 
Es natural que los espacios euclídeos isomorfos no se deben con- 
siderar diferentes, Por esto, para cualquier n, existe solamente un 
espacio euclídeo de n dimensiones en el mismo sentido en que para 
cualquier n existe solamente un espacio lineal real de n dimensiones. 
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Para el caso de espacios lineales complejos, los conceptos y resultados del 
presente párrafo se generalizan del modo siguiente: un espacio lineal complejo 
se llama espacio unitario, si en él está definido el producto escalar, donde (a, b) 
os, por lo, general, un múmero complejo. En esto caso, tienen que cumplirse los 
axiomas II—IV (on el enunciado del último axioma se debe subrayar que el 
cuadrado escalar de todo vector no nulo es real y estrictamente positivo); 
el axioma I tiene que sustituirse por el axioma 


donde la raya señala, como es usual, el paso al número complejo conjugado. 
Por consiguiente, el producto escalar ya no es conmutativo. A pesar de todo, 
so verifica una igualdad simétrica al axioma II, 


w (a, b+e)=(a, b)+ (a, c), 
ya que 
(a, bo) ==, a) Fe 0=0, aH a= la, b) Hla 0). 
Por otra parte, 
m (a, ab)=ā (a, b), 


puesto que 


(a, ab) = (ab, a) =a (b, a, =a (a, b). 


Los conceptos de sistema ortogonal y ortonormal de vectores se generalizan 
sin alteración alguna al caso de espacios unitarios. Igual que antes, se demues- 
tra la existencia de bases ortonormales en cualquier espacio unitario de dimen- 
sión finita. Sin embargo, si en este caso es, ez, .... en es una baso ortonormal 
y los vectores a, b tienen en esta base la expresión (7), se tiene 

U. b)= Y ar 


i] 


Los resultados de los párrafos posteriores del presente capítulo también 
se podrían generalizar para el caso de espacios unitarios. Aquí no lo haremos 
y proponemos al lector que le interese que consulte libros especializados 
en álgebra lineal. 
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Sea dada una transformación lineal real de n indeterminadas 
a= È dam im, 2, a, n (1) 


la matriz de esta transformación se denotará por Q. Esta transforma- 
ción lleva la suma de cuadrados de las indeterminadas z, 
Za, :-.y Zn, o sea, la forma cuadrática 214234... 2% 
que es la forma normal de las formas cuadráticas definidas positivas 
(véase el $ 28), a cierta forma en las indeterminadas Y, Ya, -- ., Yn. 
Eventualmente, esta nueva forma cuadrática también puede resultar 
ser la suma de los cuadrados de las indeterminadas y, Y», - + <> Ya, 
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es decir, puede ocurrir que se verifique la igualdad 
vitt -Hy (2) 
lo cual se convierte en una identidad después de sustituir Jas 
indeterminadas 2,, 7. ., Z, por sus expresiones (1). La trans- 
formación lineal de las indeterminadas (1) que posee esta propiedad, 
o como suele decirse, que mantiene invariante la suma de los 
cuadrados de las indeterminadas, se llama transformación ortogonal 
de las indeterminadas, y su matriz Q, matriz ortogonal. 

Existen muchas otras definiciones de transformación ortogonal 
y de matriz ortogonal, equivalentes a la expuesta anteriormente. 
Indiquemos algunas de ellas que emplearemos después. 

Ya conocemos, por el $ 26, la ley según la cual se transforma la 
matriz de una forma cuadrática al realizar una transformación lineal 
de las indeterminadas. Aplicándola a nuestro caso y teniendo en 
cuenta que la matriz de la forma cuadrática, que es la suma 
de los cuadrados de todas las indeterminadas, es la matriz unidad 
E, resulta que la igualdad (2) es equivalente a la igualdad matri- 
cial 


QEQ=E, 


o soa, 

g= (5) 
De aquí que 

=, 0) 
por lo que también se cumple la igualdad 

QU =E. (5) 


Por consiguiente, en virtud de (4), la matriz ortogonal Q se puede 
definir como una matriz para la que la matriz transpuesta Q' es igual 
a la matriz inversa Q~. Cada una de las igualdades (3) y (5) se puede 
tomar también por definición de matriz ortogonal. 

Como las columnas de la matriz Q’ son filas de la matriz Q, 
de (5) se deduce la proposición siguiente: la matriz cuadrada Q es 
ortogonal cuando, y sólo cuando, la suma de los cuadrados de todos 
los elementos de cualquiera de sus filas es igual a la unidad y la suma 
de los productos de los elementos correspondientes de dos filas cuales- 
quiera diferentes es igual a cero. De (3) se deduce la proposición 
análoga para las columnas de la matriz Q. 

Como Q’ = Q, pasando a determinantes en la igualdad (3), 
resulta la igualdad 

10P=4. 


De aquí se deduce que el determinante de una matriz ortogonal es 
igual a + 1. Por lo tanto, toda transformación ortogonal de las inde- 
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terminadas es no degenerada. Naturalmente, no se puede afirmar lo 
recíproco; señalemos también que no cualquier matriz con el deter- 
minante igual a + 1 es ortogonal. 

La matriz inversa de una matriz ortogonal es también ortogonal. 
En efecto, pasando en (4) a las matrices traspuestas, resulta: 


(07) =Y =0=(0*. 
Por otra parte, el producto de matrices ortogonales también es ortogo- 
nal. En efecto, si las matrices Q y / son ortogonales, entones 


aplicando (4) y también la igualdad (6) del $ 26 y la igualdad 
análoga que se verifica para la matriz inversa, resulta: 


(QRY = R'Q' = RQ? = (QRY'. 


En el § 37 se empleará la proposición siguiente: 

La matriz de cambio para pasar de una base ortonormal del espacio 
euclideo a otra base ortonormal cualquiera es ortogonal. 

En efecto, supongamos que en el espacio £, se han dado dos 
bases ortonormales es, €s, y €n Y Cs €g -y €n con la matriz 
de cambio Q = (9,1), 


= Qe. 


Como la base e es ortonormal, el producto escalar de dos vectores 
cualesquiera y, en particular, de dos vectores cualesquiera de la 
hase e”, es igual a la suma de los productos de las coordenadas corres. 
pondientes de estos vectores en la base e. Sin embargo, como la 
base e” también es ortonormal, el cuadrado escalar de cada vector 
de e” es igual a la unidad, y el producto escalar de dos vectores 
diversos cualesquiera de e” es igual a cero. De aquí, para las filas 
de las coordenadas de los vectores de la base e” en la base e, o sea, 
para las filas de la matriz Q, resultan las afirmaciones que son carac. 
terísticas para una matriz ortogonal, como se dedujo antes de la 
igualdad (5). 

Transformaciones ortogonales del espacio euclideo. Ahora se 
estudiará un tipo especial e interesante de transformaciones lineales 
de los espacios euclídeos, a pesar de que estas transformaciones no se 
omplearán a continuación. 

Una transformación lineal q del espacio euclideo Æ, se llama 
transformación ortogonal de éste, si mantiene invariable el cuadrado 
escalar de cada vector, es decir, si para cualquier vector a 


(aq, aq) = (a, a). (6) 


Ahora deduciremos la siguiente proposición más general que la 
anterior y que, naturalmente, también se puede tomar por defini- 
ción de iransformación ortogonal. 
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Toda transformación ortogonal œ del espacio euclideo mantiene 
invariable el producto escalar de dos vectores cualesquiera a y b, 
(a, 4) =(a, b). (7) 
En efecto, en virtud de (6), 
(a+) q, (04-0)4)=(0+b, a+). 
Pero 
(+0) 0, (a+b) 9) = (ap + bp, ap -+ 04) = 
(ag, aq) + (ap, bg) H (ba, aq) + (bep, be), 
(a+b, a+ b)=(a, a)+{a, b)+ (b, a)+ (b, D). 
De aquí, aplicando (6) para a y para b, y teniendo en cuenta la 
propiedad conmutativa del producto escalar, resulta 
2(ap, bp) =2 (a, b), 


de donde, también se verifica (7). 

En una transformación ortogonal del espacio euclideo, las imágenes 
de todos los vectores de cualquier base ortonormal forman ellas mismas 
una base ortonormal, Recíprocamente, si una transformación lineal del 
espacio euclideo transforma por lo menos una base ortonormal en otra 
base ortonormal, esta transformación es ortogonal. 

En efecto, sea una transformación ortogonal del espacio 


sea En, A Cis E2, + + e, En Una base ortonormal arbitraria de este 
espacio. En virtud de (7), de las igualdades 
(en e)=4, i=4, 2, .... A, 
(en ej) -0 para ij 
se deducen las igualdades 
(e e) =i, i 2.1 


(exp, e4)=0 para ij, 


o sea, el sistema de vectores ep, “op, - .., enp resulta ortogonal 
y normal, por lo cual, éste es una base ortonormal del espacio Ep. 
Recíprocamente, supongamos que la transformación lineal p 
del espacio E, transforma la base ortonormal ey, es, ..., e, de 
nuevo en una base ortonormal, es decir, que el sistema de vectores 
exp, Cops +. -, Enp es una base ortonormal del espacio En. Si 


a $ ae 


es un vector arbitrario del espacio E, entonces 


ag = Y o (eq), 
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o sea, el vector aq tiene en la base ep las mismas coordenadas que 
tiene el vector a en la base e. Sin embargo, ambas bases son ortonor- 
males, siendo, por consiguiente, el cuadrado escalar de cualquier 
vector igual a la suma de los cuadrados de sus coordenadas en cual- 
quiera de estas bases. Por lo tanto, 

D al, 

4 

o sea, se cumple verdaderamente la igualdad (6). 

Toda transformación ortogonal del espacio euclídeo se determina en 
cualquier base ortonormal por una matriz ortogonal. Reciprocamente, 
si una transformación lineal del espacio euclídeo se determina por una 
matriz ortogonal, aunque sólo sea en una base ortonormal, esta trans- 
formación es ortogonal. 

En efecto, si la transformación q es ortogonal y la base e, ez, + .. 
en Ea €s ortonormal, el sistema de vectores ep, eP, +. 419 
será una base ortonormal. Por consiguiente, la matriz A de la trans- 
formación q en la base e, 


(a, a) (ap, aq) 


ep= Ae, (8) 


será la matriz de cambio de la base ortonormal e por la base ortonor- 
mal ep, y, por lo demostrado anteriormente, es ortogonal. 

Recíprocamente, supongamos que la transformación lineal p se 
determina en la base ortonormal e, es, ..., en por la matriz 
ortogonal A; por consiguiente, se cumple la igualdad (8). Como 
la base e es ortonormal, el producto escalar de cualesquiera vectores 
y, en partienlar, de cualesquiera vectores del sistema ep, ep, +. 
Dia enq, es igual a la suma de los productos de las coordenadas 
correspondientes de estos vectores en la base e. De donde, como la 
matriz Æ es ortogonal, se tiene 

leg, e) 1, i=1,2, ....2 
(eu, es) =0 para ¿4 j, 

o sea, resulta que el mismo sistema e es una base ortonormal del 
especio En. De aquí se deduce que la transformación q es ortogonal. 

Por la geometría analítica sabemos, que entre todas las trans- 
formaciones afines del plano que dejan en su sitio el origen de coor- 
denadas, las rotaciones (unidas, posiblemente, con simetrías) son 
las únicas que mantienen invariante el producto escalar, Por lo 
tanto, las transformaciones ortogonales del espacio euclídeo de n 
dimensiones se pueden considerar como «rotaciones» de este espacio. 

Evidentemente, entre las transformaciones ortogonales del 
espacio euclídeo está también la transformación idéntica. Por otra 
parte, Ja relación que hemos establecido entre las transformaciones 
ortogonales y las matrices ortogonales, y también la relación expuesta 
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en el $'31 entre las operaciones con las transformaciones lineales 
y con las matrices, permiten deducir de las propiedades conocidas 
de las matrices ortogonales las siguientes propiedades de las tra 
formaciones ortogonales del espacio euclídeo, que también se com- 
prueban directamente con facilidad: 

Toda transformación ortogonal es no degenerada y su transformación 
inversa también es ortogonal. 

El producto de cualesquiera transformaciones ortogonales es orto- 


gonal. 


§ 36. Transformaciones simétricas 


Una transformación lineal del espacio cuclídeo de n dimensiones 
se llama simétrica (o bien, autoconjugada) si para cualesquiera vecto- 
res a, b de este espacio se verifica la igualdad 

(aq, D= (a, by) u) 


o sea, en el producto escalar el símbolo de la transformación simétric 

se puede trasladar de un factor a otro. 

Evidentemente, la transformación idéntica e y la transformación 

nula œ son ejemplos de transformaciones simétricas. Un ejemplo 

más general es la transformación lineal, según la cual cada vector 
so multiplica por un número fijado œ, 
aq =aa. 


a 


n efecto, en este caso 
(ap, b)= (aa, b)-=<a (a, b) = (u, ab) (a, ba). 


Las transformaciones simétricas desempeñan un papel muy 
importante y es necesario estudiarlas detalladamente. 

Toda transformación simétrica del espacio euclideo se determina en 
cualquier base ortonormal por una matriz simétrica. Recíprocamente, 
si una transformación lineal del espacio euclídeo se determina por una 
matriz simétrica, aunque sólo sea en una base ortonormal, la transfor- 
mación es simétrica. 

En efecto, supongamos que la transformación simétrica q se 
determina por la matriz A = (æ;;) en la base ortonormal €, es, -.. 
+. +, €n, Teniendo en cuenta que en una base ortonormal, el producto 
escalar de dos vectores es igual a la suma de los productos de las 
coordenadas correspondientes de estos vectores, se obtiene: 


(eu, e) =( E, tuner, 23) = ais, 


en enla Han) ay 
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y 
o sea, en virtud de (1), 
Qij = Qj 

para todos los valores de ¿ y j. De aquí, la matriz A es simétrica. 

Recíprocamente, supongamos que la transformación lineal p se 
determina por una matriz simétrica A = (4) en la base ortonormal 
Ets Cr <= Ens 

aa; para todos los valores de i y j. (2) 
Si 
b= Š bien e= Ems 
Í 


son unos vectores arbitrarios del espacio, entonces 


w= tute Y (È peades 


A 2 
D (D vjan) e 
aja 


J 
ce = Y 1,109) 
£ 
"Teniendo en cuenta que la base e es ortonormal, resulta 


le. o) = 2, Banys 


n 
(b, cẹ)= D Bijay 
1.72 
En virtud de (2), los segundos miembros de las últimas igualdades 
coinciden, así que 
(bp, 0) =(0, cp), 
que es lo que se quería demostrar. 

Del resultado obtenido se deduce la siguiente propiedad de las 
transformaciones simétricas, que también se comprueba con facilidad 
directamente: 

La suma de transformaciones simétricas y también el producto de una 
transformación simétrica por un número, son transformaciones simétricas. 

Demostremos ahora el siguiente importante teorema: 

Todas las raíces características de una transformación simétrica 
son reales. 

Como las raíces características de cualquier transformación 
lineal coinciden con las raíces características de la matriz de esta 
transformación en cualquier base y la transformación simétrica se 
determina en bases ortonormales por matrices simétricas, es sufi- 
ciente demostrar la proposición siguiente: 

Todas las raíces características de una matriz simétrica son reales. 


15* 
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En efecto, sea Ag una raíz característica (que puede ser compleja) 
de la matriz simétrica A = (a,), 
JA—AE|=0. 
Entonces cl sistema de ecuaciones lineales homogéneas con coefi- 
cientes complejos 


Douzh 11,2... 
E 


tiene un determinante igual a cero, o sea, posee solución no nula 
Bu Po ---» Pns que por lo general, es compleja; por lo tanto, 


at a) 


Multiplicando ambos miembros de cada i-ésima igualdad (3) por el 
número P;, conjugado con el número f;, y sumando por separado 
los primeros y los segundos miembros de todas las ¡gualdades obte- 
nidas, se lega a la igualdad 


3088 


El coeficiente de Ay en la igualdad (4) es un número real, diferente 
de cero, puesto que es la suma de números reales no negativos, uno 
de los cuales por lo menos es estrictamente positivo. Para demostrar 
que el número A, es real, hay que demostrar que es real el primer 
miembro de la igualdad (4), para lo cual es suficiente demostrar que 
este número complejo coincide con su conjugado, Aquí, por primera 
vez se aplicará la simetría de la matriz (real) A: 


mA cp 


ds 


d X BiBi- (0) 
4 


amó, $ ab 
- uba È añ Y ut 


Obsérvese que la penúltima igualdad se ha obtenido mediante una 
permutación simple de las notaciones de los índices de la suma: 
en lugar de i se ha puesto j, y en lugar de j se ha puesto i. Por consi- 
guiente, el teorema queda demostrado. 

Una transformación lineal q del espacio euclideo E, es simétrica 
cuando, y sólo cuando, en el espacio E, existe una base ortonormal 
formada por vectores propios de esta transformación. 

Una parte de esta proposición es casi evidente: si en E, existe una 
base ortonormal £r, ez, tal que 
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entonces en la base e la transformación q se determina por la matriz 
diagonal 
$ o 


de 


0 În 
Pero, como toda matriz diagonal es simétrica resulta que la trans- 
formación q se determina en la base ortonormal e por una'matriz 
simétrica, es decir, ella misma es simétrica. 

La proposición recíproca fundamental se demostrará por induc- 
ción sobre la dimensión n del espacio E,. En efecto, para n = 4 
cualquier transformación lineal œ del espacio E, lleva cualquier 
vector a otro que es proporcional al mismo. De esto se deduce que 
todo vector a no nulo es un vector propio para q (por cierto, resulta 
también que toda transformación lineal del espacio E, es simétrica). 
Normalizando el vector a se obtiene la base ortonormal buscada del 
espacio Ej. 

Supongamos que la tesis del teorema ya está demostrada para 
los espacios euclídeos de (z — 1) dimensiones y que en el 
espacio E, se ha dado una transformación simétrica p. Del teorema 
demostrado anteriormente se deduce la existencia de una raíz 
característica real Ay para p. Por consiguiente, para la transforma- 
ción Q, este número es un valor propio. Si a es el vector propio de la 
transformación q que corresponde a este valor propio, entonces 
cualquier vector no nulo que sea proporcional al vector a será para q 
un vector propio correspondiente al mismo valor propio Ap, puesto que 


(aa) p =a (aq) =a (da) = ho (ua). 


En particular, normalizando el vector a, resulta un vector e, tal 
que 


eip = hots 
lEn e)=1. 


Como se demostró en el $ 34, el vector no nulo e, se puede 
incluir en una base ortogonal 


ên (5) 
del espacio En. Los vectores cuyas primeras coordenadas en la base (5) 
son iguales a cero, o sea, los vectores de la forma aze, +... + Anto 


forman, evidentemente, un subespacio lineal de (n — 1) dimensiones 
del espacio En, que lo designaremos mediante L. Este será, incluso, 
un espacio euclideo de (2 — 1) dimensiones, pues, estando definido 
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el producto escalar para todos los vectores de En, lo estará particu- 
larmente para los vectores de L, poseyendo además todas las pro- 
piedades necesarias. 

El subespacio L consta de todos los vectores del espacio E 
que son ortogonales al vector e,. En efecto, si - 


a aye + ae, + 


como la base (5) es ortogonal y el vector e, normal, resulta 
(en a) =0 (er, e) Haz (en es)... antes, en) =0%, 
o sea, (e, a) = O cuando, y sólo cuando, æ; = 0. 

Si el vector a pertenece al subespacio L, es decir, si (e1, a) = 0, 
el vector ap también pertenecerá a Z. En efecto, como la transfor- 
mación « es simétrica, resulta 

(es, ap) = (erp, a) = (hoes, 4) — Ao (er, 2) 20:00, 

o sea, cl vector aq es ortogonal a e, estando por esto contenido en L. 
Esta propiedad del subespacio L, llamada invariabilidad con respecto 
a la transformación q, permite considerar a q, aplicándola solamente 
a los vectores de L, como una transformación lineal de este espacio 
euclídeo de (n — 1) dimensiones. Esta será, incluso, una transfor- 
mación simétrica del espacio L, pues, la igualdad (1), cumpliéndose 
para cualesquiera vectores de En, se cumple particularmente, para 
los vectores situados en L. 

Por la suposición de la inducción, en el espacio Æ existe una base 
ortonormal compuesta de vectores propios de la transformación q; 
designémosla mediante ez, ..., en. Todos estos vectores son 
ortogonales al vector ey; por consiguiente, es, €s, » -., €/ será Ja 
base ortonormal buscada del espacio £,, que consta de vectores 
propios de la transformación q. El teorema queda demostrado. 


$ 37. Reducción de una forma cuadrática 
a los ejes principales. Par de formas 


Apliquemos el último teorema del párrafo precedente para la 
demostración del siguiente teorema matricial: 

Para cualquier matriz simétrica A se puede hallar una matriz 
ortogonal Q que reduzca la matriz A a la forma diagonal, o sea, gue la 
matriz Q- AQ, que es la transformada de la matriz A por la matriz 
Q, resulta diagonal. 

Sea dada una matriz simétrica A de orden n. Si ep, es, «a, €. 
es una base ortonormal del espacio euclídeo E, de n dimensiones, la 
matriz A determina en esta base una transformación simétrica q. 
Por lo demostrado, en E, existe una base ortonormal fi, fa, +. -> fn, 
compuesta de vectores propios de la transformación q; en esta base, q 
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se determina por una matriz diagonal B (véase el $ 33). Entonces, 
en virtud del $ 31, 


B=Q4Q, (1) 
donde Q es la matriz de cambio de la base f a la base e, 

e=Qf. (2) 
Esta matriz, como matriz de cam de unal base ortonormal a 


otra base ortonormal, es ortogonal (véase el $ 35). El teorema queda 
demostrado, 

Como para una matriz ortogonal Q la matriz inversa es la trans- 
puesta, Q~} = Q’, la igualdad (1) se puede escribir en la forma 


B=Q'4Q; 


no obstante, por el $ 26 se sabe que precisamente así 3e transforma 
la matriz simétrica A de una forma cuadrática, sometida a una 
transformación lineal de las indeterminadas de matriz Q. Teniendo 
en cuenta que una transformación lineal de las indeterminadas 
de matriz ortogonal es una transformación ortogonal (véase el $35) 
y que la forma cuadrática reducida a la forma canónica tiene una 
matriz diagonal, basándonos en el teorema precedente obtenemos 
el siguiente teorema de reducción de una forma cuadrática real 
a los ejes principales: 

Toda forma cuadrática real f (21, X2, « - ., Tn) se puede reducir a la 
forma canónica mediante una transformación ortogonal de las inde- 
terminadas. 

A pesar de que puedan existir muchas transformaciongs ortogo- 
nales diferentes de las indeterminadas que reduzcan la forma cuadrá- 
tica dada a la forma canónica, ésta se determina en lo fundamental 
univocamente: 

Cualquiera que sea la transformación ortogonal que reduzca la forma 
cuadrática f (41, doy «==, Zn) de matriz A a la forma canónica, los 
coeficientes de esta forma canónica son las raíces características de la 
matriz A, tomadas con sus órdenes de multiplicidad. 

En efecto, supongamos que la forma f se ha reducido ya a la forma 
canónica 


Ilan Tar. Ai Bayad + E lo 


mediante una transformación ortogonal. 

Esta transformación ortogonal mantiene inva: 
de los cuadrados de las indeterminadas, de donde, 
indeterminada, se tiene 


iable la suma 
% os una nueva 


Ax 


feta y 
, 
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Pasando a los determinantes de estas formas cuadráticas y teniendo 
en cuenta que después de realizar la transformación lineal el deter- 
minante de la forma cuadrática se tiplica por el cuadrado del 
determinante de la transformación (véase el $ 28), y que el cuadrado 
del determinante de una transformación ortogonal es igual a la 
unidad (véase el $ 35), llegamos a la igualdad 


[reas E A 
jae 0 
o DO ses A 


de la que se deduce la tesis del teorema. 

Este resultado se puede formular también de una forma matri- 
cial: 

Cualquiera que sea la matriz ortogonal que reduzca la matriz simé 
trica A a la forma diagonal, en la diagonal principal de la matriz 
diagonal obtenida figurarán las raíces características de la matriz A, 
tomadas con sus órdenes de multiplicidad. 

Averiguación práctica de la transformación ortogonal que reduce 
una forma cuadrática a los ejes principales. En algunos problemas 
no sólo es necesario conocer la forma canónica a que se reduce una 
forma cuadrática real mediante una transformación ortogonal, sino 
también la transformación ortogot que realiza esta reducción. 
Sería difícil buscar esta transformación empleando la demostración 
del teorema de reducción a los ejes principales, y queremos mostrar 
otro camino. Para esto sólo hace falta aprender a hallar la matriz 
ortogonal Q que reduce la matriz simétrica dada A a la forma 
gonal o, lo que es lo mismo, a hallar su matriz inversa Q. En 
virtud de (2), ésta es Ja matriz de cambio de la base e a la base f, 
es decir, sus filas son filas de las coordenadas (en la base e) del 
sistema ortonormal compuesto por z vectores propios de la trans- 
formación simétrica q, determinada por la matriz A en la base e 
No queda más que hallar tal sistema de vectores propios. 

Sea hy cualquier raíz característica de la matriz A y supongamos 
que su orden de multiplicidad es igual a kọ. Por el $ 33'se sabe que el 
conjunto de las filas de coordenadas de todos los vectores propios de 
la transformación «, correspondientes al valer propio 2g, coincide 
con el conjunto de las soluciones no nulas del sistema de ecuaciones 
lineales homogéneas 

(4— rE) X=0; 8) 


como la matriz A es simétrica, se puede escribir A en lugar de A’. 
De los teoremas de existencia de una matriz ortogonal que reduzca la 
matriz simétrica A a la forma diagonal, demostrados anteriormente. 
y de la unicidad de esta forma diagonal, se deduce que para el siste- 
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ma (3) se pueden hallar siempre ko soluciones linealmente indepen- 
dientes. Este sistema de soluciones se halla por los métodos conoci- 
dos en el $ 12, ortogonalizando y normalizando después el sistema 
obtenido según el $ 34. 

Tomando por A, cada una de las raíces características distintas 
de la matriz simétrica A y teniendo en cuenta que la suma de los 
órdenes de multiplicidad de estas raíces es igual a n, se obtiene un 
sistema de n vectores propios de la transformación q, dados por sus 
coordenadas en la base e. Para demostrar que éste es el sistema 
ortonormal de los vectores propios buscados, no queda más que 
demostrar el siguiente lema: 

Los vectores propios de una transformación simétrica p que co- 
rresponden a valores propios distintos son ortogonales entre sí. 

En efecto, supongamos que 

by =2b, cy = Aae, 
siendo A, âz. Como 
(bp, c)= (Ab, c) = M (b, c), 
(b, co) = (b, Aac) = Aa (b, c), 
de 
(bp, c) = (b, c4) 
se deduce que 
M(b, c)=Ag!(b, c) 
y, puesto que A4 Az, resulta 
(b, c)=0, 


que es lo que se quería demostrar. 


Ejemplo. Reducir la forma cuadrática 
lEt Za, Za, z, 


a los ojes principales. 
La matriz A de esta forma es 


G $ aot 


+ 2129 —2x124— 229244 229240) 22924 


1-1 0 4 
A 1.1.0 

Hallemos su polinomio característico: 

-A i 4-1 
1 -% i 
1-1 à 

1. 1. 4 —a 


¡A-14E|= =A 43). 
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Por lo tanto, la matriz A tiene la raíz característica 1 de orden tres y la raíz 
característica simple —-3, Por consiguiente, ya so puede escribir la forma canó- 
nica a que se reduce la forma f mediante una transformación ortogonal: 


f= tH huia. 


Hallemos la transformación ortogonal que realiza esta reducción. El sistema de 
ecuaciones lineales homogéneas (3) para As = 1 toma la forma 


2374 =0, 
z,=0, 


E 0, 


=z ba 
z, 


12—%3 


—n tata. 0. 
El rango de este sistema es igual a 4. Por lo tanto, para ésto se pueden hallar 
tres soluciones linealmente independientes. Estas son, por ejemplo, los vectores 
b,=(1, 1, 0, 0), 
b2—(1, 0, 4, 0). 
b3=(—=1, 0, 0, 1). 
lema de vectores, se obtiene ol sistema de vec- 


ley —b= (1, 4, 0, 0), 


ak a 1 m= (5. 


Ortogonalizando esto 
tores 


ii 


Por otra parte, el sistema de ecuaciones lineales homogéneas (3) para 
Ao ——3, toma la forma 


Bay + ze rg 2420 
21 4-3rg— 90-140, 
Ti —29 4373-74 =0, 
—a1 1 za iara dz 0. 
El rango do este sistema es igual a 3. El vector 
e4=(1, —1, —1, 1). 
es una solución no nula. 


El sistema de vectoros ci, ca, ca, c4 es ortogonal. Normalizando este sistema 
llegamos al sistema ortonormal de vectores 
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Por lo tanto, la forma f se reduce a los ejes principales mediante 
la transformación ortogonal 


1 1 


MA 


ta 


s menester señalar que la elección del sistema de vectores propios, lineal- 
mente indopondientes, Correspondientes a un valor propio múltiple, goza. do 
mucha pluralidad; de aquí que existan muchas transformaciones ortogonales 
distintas que reducen 1a forma f a la forma conónica. Aquí sólo hemos hallado 
mna de éstas, 


Par de formas. Sea dado un par de formas cuadráticas en n indeter- 
minadas, f(x, eons Ta) Y E (fr Tes +. ss Zn). ¿Existe algu- 
na transformación lineal no degenerada de las indeterminadas 
Lis Za, -y En que reduzca simultáneamente ambas formas a la 
forma canónica? 

En el caso general, 
el par de formas 


la respuesta es negativa. Veamos, por ejemplo, 


Fs 


Supongamos que existe una tra 


formación lineal no degenerada 
alas 
) (4) 


que reduce ambas formas a la forma canónica. Para que la forma f 
pueda reducirse por la transformación (4) a la forma canónica, uno de 
los coeficientes c;;, cyz tiene que ser igual a cero, si no aparecería el 
término 2 c4; Cy YY. Cambiando la numeración de las indeterminadas 
Y» Yo, si esto fuese necesario, se puede suponer que cy — 0, de 
donde c, 0. Sin embargo, ahora resulta que 


tuya 


8 (Z1, 22) = CY (Cars |- C2292) = Cul i -H Catan 


Como también la forma g tiene que reducirse a la forma canónica, 
tiene que ser ĉ4,ĉ2> = 0, es decir, czs = 0, lo cual, junto con cys = 0, 
nos lleva a lo absurdo, pues la transformación lincal (4) no es dege- 
nerada. 
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La situación será diferente si se supone que al menos una de 
nuestras formas, por ejemplo, g (Z1, T2, . . -, Tn) es definida posi- 
tiva *. Subsiste el teorema siguiente: 

Si f y g es un par de formas cuadráticas reales en n indeterminadas, 
siendo la segunda de ellas definida positiva, existe una transformación 
lineal no degencrada que reduce simultáneamente la forma g a la 
forma normal y la forma f a la forma canónica, 

Para la demostración, realicemos primero una transformación 
lineal no degenerada de las indeterminadas xy, Zo, +. -, Zn, 


X=7TY, 
que reduzca la forma definida positiva g a la forma normal, 
E (En Zar, En) HH -e e 


En este caso, la forma f se reduci 
indeterminadas, 


a otra forma «q en las nuevas 


Í (Eir Ta, +1 En) = E (Yis Yas ++ +s Un)+ 
Realicemos ahora una transformación ortogonal de las indetermi- 
nadas Yi, Yar ===> Uno 
Y=QZ, 


que lleve la forma y a los ejes principales, 
P (Yn Yar +- -r Yn) = Azi + Aozi H 


Esta transformación (véase la definición en el $ 35) lleva la suma 
de los cuadrados de las indeterminadas yy, Yo, .. -» yn a la suma 
de le cuadrados de las indeterminadas z;, Za, y Zn. Por lo tanto, 
resulta 


+ Ant 


Í (Ei Ta 2) = M2 + haza t 


Elfs Ta 120) =2 7 
o sea, la transformación lineal 
X=(10)Z 


es la buscada. 


* Claro, esta condición no es necesaria; así, pues, las formas z) + 13$ — s$ 
y zł — zł} — 23 ya tienen la forma canónica, a pesar de que entre ellas no hay 
definidas” positivas, 


CAPITULO IX 


CALCULO DE LAS RAICES 
DE LOS POLINOMIOS 


$ 38. Ecuaciones de segundo, tercero y cuarto grados 


El teorema fundamental demostrado en el $ 23 establece la 
existencia de n raíces complejas para cualquier polinomio de 
n-ésimo grado con coeficientes numéricos. Sus demostraciones (la 
expuesta anteriormente, así como otras conocidas actualmente) 
no proporcionan, sin embargo, métodos para la averiguación práctica 
de estas raíces, representando «demostraciones de existencia» puras. 
Naturalmente, las investigaciones hechas para descubrir tales 
métodos comenzaron por las pruebas de deducción de fórmulas análo- 
gas a la fórmula para la resolución de la ecuación cuadrática, bien 
conocida por el lector para el caso de coeficientes reales en el curso 
escolar de álgebra. Ahora demostraremos que esta fórmula es válida 
también para las ecuaciones cuadráticas con coeficientes complejos, 
y que so pueden deducir fórmulas análogas, aunque más complicadas, 
para las ecuaciones de tercero y cuarto grados. 

Ecuaciones cuadráticas. Sea dada la ecuación cuadrát 


2.4 pr4-q=0 


con cualesquiera coeficientes complejos; sin restringir la generalidad 
se puede suponer que el coeficiente superior es igual a uno. Esta 
ecuación se puede escribir en la forma 


OS 


Como es sabido, se puede extraer la raíz cuadrada del número com- 
a 
plejo Æ — q sin salir del sistema de los números complejos. Los 


dos valores de la raíz, que se diferencian entre sí solamente en el 


a 
signo, los escribiremos en la forma + Y/ E; — q. Por lo tanto, 
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o sea, las raíces de la ecuación dada se pueden hallar por la fór- 
mula ordinaria 


+y 4 


Ejempo. Resolver la ecuación 
2301 (34) 0. 


Aplicando la fórmula obtenida, resulta: 


de donde 


Ecuaciones cúbicas. A diferencia del caso de las ecuaciones cua- 
dráticas, hasta ahora no tenemos un método para la resolución de las 
ecuaciones cúbicas, incluso en el caso de coeficientes reales. Ahora 
obtendremos para las ecuaciones cúbicas una fórmula análoga a la 
fórmula para las ecuaciones cuadráticas, suponiendo además que los 
cocficientes son cualesquiera números complejos. 

Sea dada la ecuación cúbica 


y 4ay 4 by +e = 


0 (1) 


con coeficientes complejos cualesquiera. Sustituyendo en la ecua- 
ción (1) la incógnita y por una nueva incógnita z, ligada a y por 
medio de la igualdad 


y=- 7> (2) 


resulta una ecuación para la incógnita z; esta ecuación, como fácil 
mente se comprueba, no contiene el cuadrado de esta incógnita, o sea, 
es una ecuación de la forma 


4 pr+q=0. 8) 


Hallando las raíces de la ecuación (3), en virtud de (2), se obtienen 
también las raíces de la ecuación (1). Por consiguiente, no queda más 
que aprender a resolver la ecuación cúbica «reducida» (3), con cuales- 
quiera coeficientes complejos. 

Por el teorema fundamental, -la ecuación (3) posee tres raíces 
complejas. Sea zo una de estas raíces. Introduzcamos una incógnita 
auxiliar u y examinemos el polinomio 
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Sus coeficientes son números complejos, poseyendo por lo tanto dos 
raíces complejas æ y B. Por las fórmulas de Vieta: 


a-i- B= zo (4) 
ap —E. (5) 


Poniendo en (3) la expresión (4) de la raíz zo, resulta 


Pri pla+B)+9=0, 


añ po (SaB + p) (+p) -+g = 0. 
Sin embargo, de (5) se deduce que 3 a$+p=0; de donde resulta: 


o bien 


+= q. (6) 
Por otra parte, de (5) se deduce que 
ap, o 


Las igualdades (6) y (7) mu 
raíces de la ecuaci 


(8) 
con coeficientes complejos. 
Resolviendo la ecuació 
de donde” 
V o 


Hemos obtenido la si e fórmula, conocida por el nombre de 
fórmula de Cardano, que exp es de la ecuación (3) mediante 
sus coeficientes valiéndose de radicales cuadrados y cúbicos: 


e ai v tey 


Como el radical cúbico tiene tres 
números complejos, las fórmulas (9) 
valores para B. Sin embargo, al aplicar la fórmul 
puede combinar cualquier valor del radical œ con cualquier valor 

* No importa cuál de las raices de la ecuación ($) s 
por p3, puesto que en las igualdade: 
a y B están situadas simótricament 


lores 


por a3 y cuál 


240 Cap. IX Cálculo de las raíces de los polinomios 


del radical B: para un valor dado de œ se debe tomar solamente 
aquél de los tres valores de $ que satisface a la condición (5). 

Sea a, uno de los tres valores del radical a. Entonces, como se ha 
demostrado en el $ 19, los otros dos se pueden obtener multiplicando 
a, por las raíces cúbicas e y e° de la unidad: 


Aa=0e, ae. 


Designemos con ĝ; el valor del radical p que corresponde al valor 


a, del radical a según (5), de modo que aß; = — $. 
Los otros dos valores de P serán 
Pa=Bre, Ba = Bie’. 
Como &=4, 
a ae pet ape af i 


3 
el valor æ; del radical œ corresponde al valor B, del radical P; aná- 
logamente el valor Bz corresponde al valor œ,. Por lo tanto, tod 
las raícos de la ecuación (3) se pueden escribir del modo siguiente: 
204 + Bas 
T,= Qa + B= 08 + Bye, (10) 
Za = a+ Pa = aye? + Bye. 
Ecuaciones cúbicas con coeficientes reales. Veamos lo que se puede 
decir de las raíces de la ecuación cúbica reducida 
z*+pr+q =0, (11) 
si sus coeficientes son reales. 1 


le este caso, desempeña un papel 
fundamental la expresión % -+ 


r que figura en la fórmula de Car- 
dano bajo radical cuadrado. Obsérvese que el signo de esta expresión 
es contrario al signo de la expresión 


D=—4pP—2= —108 (T+) 


denominada discriminante de Ia ecuación (11) (compárese más abajo, 
$ 54); en las formulaciones posteriores se usará el signo del discri- 
minante. 

1) Sea D < 0. En este caso, en la fórmula de Cardano, bajo el 
símbolo de cada uno de los radicales cuadrados figura un número 
positivo. Por esto, los números que figuran bajo los símbolos de cada 
uno de los radicales cúbicos son reales. Sin embargo, la raíz cúbica 
de un número real tiene un valor real y dos valores imaginarios 
conjugados. Sea a, un valor real del radical a; el valor $, del radical f 
que corresponde a a por la fórmula (5), también será real, pues, el 
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número p también es real. Por lo tanto, resulta que la raíz z; = 

= a Pi do la ecuación (11) también es real. Las otras dos 
raíces so hallan sustituyendo en las fórmulas (10) del presente párrafo 
las raices de la unidad e = e, y e? = e, por sus expresiones (7) 
del $ 19: 


2 at teo ( 


como los números æ, y f, son reales, estas dos raíces son números 
imaginarios conjugados, pues, el coeficiente de la parte imaginaria 
es diferente de cero, debido a que «+ Py; éstos son valores de 
distintos radicales cúbicos. 
Por lo tanto, si D < 0, la ecuación (11) tiene una raiz real y dos 
raices imaginarias conjugados. 
2) Sea D=0. En este 


Sea a, un valor real del radical a; en virtud de (5), B, también será 
un número real, siendo a; = By. Sustituyendo en las fórmulas (10), 
Bı por a, y aplicando la igualdad e + eë = —1, resulta: 


2,201, 2¿=0/ (84) =—0%, Ta = (€) = —%. 


Por lo tanto, si D = O, todas las raíces de la ecuación (11) son 
reales, siendo dos de ellas iguales entre sí. 

3) Sea, finalmente, D > 0. En este caso, en la fórmula de Car- 
dano, bajo el radical cuadrado figura un número real negativo y, por 
consiguiente, bajo los radicales cúbicos figuran números imaginarios 
conjugados. En consecuencia, todos los valores de los radicales a y P 
son ahora números imaginarios. No obstante, entre las raíces de la 
ecuación (11) tiene que haber por lo menos una real, Supongamos 
que ésta es la raíz 


1, =% + Bo. 
Como son reales tanto la suma de los números %y y Bọ como su pro- 
ducto, igual a — Ż , los números œo y Bo son conjugados entre sí, pues 


son raíces de una ecuación cuadrática con coeficientes reales. Pero, 
entonces, son conjugados entre sí también los números «ge y Poe”, 
16-252 
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y también los números aye? y Bos, de donde se deduce que Jas raíces 
de la ecuación (11) 


T, ae 


también son números reales. 

Ha resultado que las tres raíces de la ecuación (11) son reales y, 
además, como fácilmente se comprueba, entre ellas no hay iguales. 
En caso contrario, la elección de la raíz x se podría realizar de modo 
que se cumpliese la igualdad z: = £s, de donde 


ao (e— e°) = Bo (£ — e°), 


o sea, o — Bo, lo cual es imposible. 

Por lo tanto, sí D >Q, la ecuación (11) tiene tres raíces reales 
distintas. 

El último caso que acabamos de examinar muestra que el valor 
práctico de la fórmula de Cardano es insignificante. 

A pesar de que para D > 0 todas Jas raíces de la ecuación (11) 
con coeficientes reales son números reales, el cálculo de éstas por la 
fórmula de Cardano requiere la extracción de raíces cúbicas de 
números imaginarios, lo que sabemos hacer solamente pasando estos 
números a la forma trigonométrica. Por esta razón, la expresión 
de las raíces mediante los radicales pierde su valor práctico. Con 
métodos que están fuera de los alcances de este libro, se podría demos- 
trar que en el caso considerado las raíces de la ecuación (11) no se 
pueden expresar de ningún modo mediante los coeficientes, emplean- 
do radicales con expresiones reales bajo los radicales. Este caso de 
solución de la ecuación (11) so llama irreducible (jno confundir con 
la irreducibilidad de los polimonios 


Boe’, ra= aoe? i Bae 


Ejemplos. 1. Resolver la ecuación 


La sustitución y 


Aquí p= —6, q= —9 por lo cual 
o 
Eu dad kaii 
o sea, la ecuación (12) tiene una raíz real y dos raices imaginarias conjuga- 
das. Según (9), 


i 

9 
ay T 
Por consiguiente, a= 2, 
Van por Jas fórmulas (1 


OE, 
7 y5, $ y 


Bi=1, o sea, 113. Las otras dos raíces se ha- 
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Do aquí se deduce que las raíces de la ecuación dada son: 


YE. 


2. Resolver la ecuación 


1204 16--0. 


Aquí p=—12, q=16, por lo tanto, 
e, 


De aquí se deduce que a=} Z 


i, o sea, a= consecuencia, 
T= —4, 17 =13=2 
3. Resolver la ecuación 
z3— 19r +300. 


Aquí p= —19, q—30, de donde 


784 


<0. 


Así, manteniéndose en el campo de los números reales, la fórmula de Cardano 
no es aplicable a pesar de que sus raices son los números reales 2, 3 y —5 


Ecuaciones de cuarto grado. La resolución de la ccuación de 
cuarto grado 

y Lay? 4 bya ey d=0 (13) 

con coeficientes complej 

una ecuación cúbica au 

te, perteneciente a Ferrari. 


arbitrarios se reduce a la resolución de 
to se consigue con el método siguien- 


Se reduce previamente la ecuación (13) con la sustitución 
y z— T a la forma 
zt pa i qr+r=0. (14) 


Luego, el primer miembro de esta ecuación se transforma idénti- 
camente mediante el parámetro auxiliar æ, del modo siguiente: 


+a)? 
o bien 


(ttha) —[2ur—ar+ (uti para 2)]-0. (15) 


Elijamos ahora a de modo que el polinomio que figura entre cor- 
chetes sea un cuadrado completo. Para esto, es necesario que tenga 
una raíz múltiple, es decir, se tiene que cumplir la igualdad 


8420 (084 pa—r+ 2) =0. (16) 
16* 


at p prt 4 qr r- (a ñ a —2ax*— pa, 
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La igualdad (16) es una ecuación cúbica con respecto a la incógnita œ 
con coeficientes complejos. Como se sabe, esta ecuación tiene tres 
raíces complejas. Sea œo una de ellas; en virtud de la fórmula de 
Cardano, ésta se expresa por radicales mediante los coeficientes de la 
ecuación (16), o sea, mediante los coeficientes de la ecuación (14). 

Con tal elección del valor de æ, el polinomio que figura entre 


corchetes en (15) tiene una raíz múltiple A , de segundo orden. Por 
consiguiente, la ecuación (15) toma la forma 


2 > ta ay 
ELA —200 (+32) 
(417400) — 2a (12) =0, 
es decir, se descompone en dos ecuaciones cuadrática: 


) 
) 


an obtenido de la ecuación (14) 
haciendo transformaciones idénticas, las raíces de las ecuaciones (17) 
serán también raíces de la ecuación (14). Fácilmente se observa 
tambión que las raíces de la ecuación (14) se expresan por radicales 
mediante los coeficientes. Aquí no escribiremos las fórmulas corres- 
pondientes, pues son muy complicadas y prácticamente inútiles; 
tampoco estudiaremos separadamente el caso en que la ecuación (14) 
tenga coeficientes reales. 

Observación sobre las ecuaciones de grado superior. A pesar de 
que Jos griegos ya conocían los métodos de resolución de las ecua- 
ciones cuadráticas, el descubrimiento de los métodos de resolución 
de las ecuaciones de tercero y cuarto grado, expuesto anteriormente, 
pertenece al siglo XVI. Durante casi tres siglos se continuaron haciendo 
estériles pruebas para dar el paso siguiente, es decir, para hallar 
fórmulas que expresasen las raíces de cualquier ecuación de quinto 
grado (o sea, de una ecuación de quinto grado con coeficientes lite- 
rales) mediante sus coeficientes por radicales. Estas pruebas ter- 
minaron en los años veinte del siglo pasado, después de que Abel 
demostró que no existen tales fórmulas para las ecuaciones de n-ésimo 
grado, cuando n > 5. 

Sin embargo, el resultado de Abel no excluía la posibilidad de que 
las raíces de cualquier polinomio concreto con coeficientes numéricos 
se pudiesen expresar de algún modo mediante los coeficientes emplean- 
do alguna combinación de radicales o, como está convenido decir, 
que cualquier ecuación se resolviese por radicales. El problema 
sobre las condiciones según las cuales una ecuación dada es resoluble 
por radicales fue estudiado detalladamente por Galois, en los años 


e 1 
-o f gi 
J 


Como las ecuaciones (17) s 
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treinta del siglo pasado. Resultó que para cualquier n, empezando 
desde n = 5, se pueden indicar ecuaciones de n-ésimo grado irresolu- 
bles por radicales, que tienen incluso coeficientes numéricos enteros. 
Tal es, por ejemplo, la ecuación 


—4—2=0. 


Las investigaciones de Galois influyeron definitivamente en el 
desarrollo del álgebra. Sin embargo, nuestra tarea no incluye su 
exposición. 
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Ya sabemos que no existe un método para calcular los valores 
exactos de las raíces de los polinomios con coeficientes numéricos. 
No obstante, diversos problemas de la mecánica, de la física y de la 
técnica se reducen al problema de las raíces de los polinomios, los 
cuales suelen ser a veces de grados suficientemente altos. Esta cir- 
cunstancia fue la causa de numerosas investigaciones que tenían por 
objeto aprender a hacer tales o cuales deducciones sobre las raíces 
de los polinomios con coeficientes numéricos sin conocer estas raíces. 
Se estudiaba, por ejemplo, la cuestión sobre la posición de las raíces 
en el plano complejo (las condiciones según las cuales todas las 
raíces están dentro del círculo unidad, o sea, que en su valor abso- 
luto son menores que la unidad, o bien, las condiciones para que 
todas las raíces estén situadas en el semiplano izquierdo, o sea, que 
sus partes reales fuesen negativas, ete). Para los polinomios de 
coeficientes reales, se elaboraban métodos de definición del número 
de raíces reales, se buscaban las cotas entre las que podían estar 
estas raíces, etc. Finalmente, fueron dedicadas muchas investiga- 
ciones a los métodos del cálculo aproximado de las raíces. Ordina- 
riamente, en las aplicaciones técnicas es suficiente conocer solamente 
los valores aproximados de las raíces con cierta exactitud prefijada, 
y si, por ejemplo, las raíces del polinomio se expresasen incluso 
por radicales, éstos se sustituirían de todos modos por sus valores 
aproximados. 

En su tiempo, todas estas investigaciones formaban el contenido 
fundamental del álgebra superior. En nuestro curso está incluida 
solamente una parte muy pequeña de los resultados relacionados con 
esto y, teniendo en cuenta las necesidades primarias de las apli- 
caciones, nos limitaremos al caso de polinomios de coeficientes reales 
y de sus raíces reales, saliéndonos pocas veces de estos límites. 
Además, se va a considerar sistemáticamente el polinomio f (z) 
de coeficientes reales como una función real (continua) de la variable 
real z. Siempre que sea útil se emplearán los resultados y métodos 
del análisis matemático. 
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Es conveniente comenzar el estudio de las raíces reales de un 
polinomio f (z) de coeficientes reales considerando la gráfica de 
este polinomio. Evidentemente, las raíces reales del polinomio son las 
abscisas de los puntos de intersezción de su gráfica con el eje £, y sólo éstas. 

Veamos, por ejemplo, el polinomio de quinto grado 


Mo) 4254 8t — Ta — 3. 


Por los resultados del § 24, sobre las raíces de este polinomio, se 
puede afirmar lo siguiente: como es de grado impar, / (2) tiene por 
lo menos una raíz real; si el número de raíces reales es mayor que 

u rá igual a tres o a cinco, pues 
as raices imaginarias son conjugadas 
a pares. 

El estudio de la gráfica del poli- 
nomio » (2) permite afirmar algo má 
sobre sus raíces. Tracemos esta gráfica 
(fig. 9) *, considerando sólo los valores 
enteros de z y calculando los valores 
correspondientes de / (+) por el método 
de Horner: 


yA 


4-32 1 ` 
Vemos, pues, que el polinomio h (2) 
posee al menos tres raíces reales: una 
positiva œ, y dos negativas 2 Y &s, 
siendo 
Fig. 9. 1<4<2, —1<0<0, 
—4<0<-—3. 

La información sobre las raíces (reales) del polinomio, obtenida 
al examinar la gráfica, suele ser prácticamente bastante buena. Sin 
embargo, siempre quedan algunas dudas: no se sabe si verdadera- 
mente se han hallado todas las raíces o no. Así, en el ejemplo consi- 


* En el dibujo, en el eje y se ha tomado una escala diez veces menor que 
en el eje z. 
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derado nò se ha demostrado que a la derecha del punto z = 2 y a 
la izquierda del punto z - —4 ya no hay raíces del polinomio. 
Además, como sólo se han tomado valores enteros de z, se puede 
suponer que la gráfica trazada refleja con poca exactitud el 
comportamiento de la función h (z), pueda ser incluso que no tenga 
en cuenta algunas de sus más pequeñas oscilaciones, perdiéndose así 
algunas raíces. 

Claro, al construir la gráfica se podrían tomar no sólo los valores 
enteros de z, sino también valores que se diferenciasen en 0,1 o en 
0,01. Sin embargo, con esto se complicarían considerablemente los 
cálculos de los valores de h (z), y de todos modos persistirían las 
dudas indicadas anteriormente. Por otra parte, con los métodos del 
análisis matemático se podrían hallar los máximos y mínimos de la 
función h (2) y comparar nuestra gráfica con el comportamiento 
verdadero de la función; pero esto trae consigo la cuestión sobre las 
raíces de la derivada /” (x), o sea, el mismo problema que estamos 
resolviendo. 

De aquí surge la necesidad de métodos más perfectos para la 
búsqueda de colas entre las que están comprendidas las raíces 
reales de un polinomio de coeficientes reales, y la determinación 
del número de estas raíces, Ahora nos vamos a ocupar del problema 
sobre las cotas de las raíces reales, dejando para los siguientes párrafos 
la cuestión sobre la cantidad de estas raíces. 

La demostración del lema sobre el módulo del término superior 
(véase el $ 23) proporciona a cota para los módulos de Jas 
raíces de un polinomio. En efecto, haciendo h 1 en la desigual- 
dad (3) del $ 23, resulta que, para 


lalo w 


donde ay es el coeficiente superior y A, el máximo de los módulos 
de los demás coeficientes, el módulo del término superior del poli 
nomio es mayor que el módulo de la suma de todos los demás térmi- 
nos. Por consiguiente, ningún valor de x que satisfaga a la desigual- 
dad (1) puede ser raíz de este polinomio. 

Por lo tanto, para un polinomio f (x) con cualesquiera coeficientes 


numéricos, el número 4 -+ 2 es una cota superior para los módulos 


de todas sus raíces, reales o imaginarias. Así, pues, para el polinomio 
h (x) examinado más arriba, esta cota es el número 9, puesto, que 
a = 1, A = 8. 

No obstante, esta cota suele ser demasiado grande, si sólo nos 
interesan las cotas de las raíces reales. Ahorase expondrán otros métodos 
más exactos. Hay que tener presente que a pesar de que se marquen 
las cotas entre las que tienen que estar comprendidas las raíces 
reales del polinomio. esto no significa que tales raíces existan. 
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Demostremos primero que es suficiente conocer la cola superior de 
las raíces positivas de cualquier polinomio. En electo, sea dado un 
polinomio f (z) de grado n y sea No una cota superior de sus raíces 


positivas. Examinemos los polinomios 


positivas; supongamos 
pectivamente. Entonces, 


el número y- será una cota inferior de las raíces positivas del polinomio 
i 


4 PAP $ 4 siii 
si æ es una raíz positiva de / (+), $ es wna raíz positiva de 


que éstas son los números Ny, Nas y A 


J (2), pues, 

EN 1 
We (2), y de << Ny, resulta a > m 
son las cotas inferior y superior, respectivamente, de las 


logamente, los números 


N 
raices negativas del polinomio f (z). Por lo tanto, todas las raíces 
positivas del polinomio f (x) sati: ; 
<No y todas las raíces negativas, satisfacen a las desigualdades 
1 


en a las desigualdades $, < z < 


=N¿<xI<— 


Para determinar una cota superior de las raíces positivas se puede 
aplicar el método siguiente. Sea dado un polinomio 


$) =0x "Ya 14... Han 


con coeficientes reales, siendo ay > 0. Supongamos ahora que ar. 
k>1, es el primer coeficiente negativo; si no hubiese tales coeficien- 
tes, el polinomio f(z) no podría tener raíces positivas. Sea, 
finalmente, B el máximo valor absoluto de los coeficientes negati- 
vos. Entonces el número 


es una cota superior de las raíces positivas del polinomio f (x). 

En efecto, suponiendo z > 1 y sustituyendo cada uno de los 
coeficientes ay, Ae, - - -, ap- por cero y cada uno de los coeficion- 
tes Ap, ar41, - > + + An por B, se puede disminuir solamente el valor 


$ 39. Acotación de las raíces 249 


del polinomio, resultando 
10) > a2” BA anit 


y, como 2>1, 


an-s- 


+241) =a" — B 


Brn-h+i  gn-k+t 


H) >ar" T ltor" (z—1)— B]. (2 


Si 
> yl, (3) 


az" (a 1) —B >a (21) —B, 


la expresión que figura entre corchetes en la fórmula (2) resulta posi- 
tiva, sea, en virtud de (2), el valor de f(z) es estrictamente 
positivo. Por lo tanto, los valores de z que satisfacen a la desigual- 
dad (3) no pueden ser raíces de / (z), como se quería demostrar. 

Para el polinomio % (z) considerado anteriormente, como 
y B = 7, para la cota superior de las raíces positivas este método 
da el número 1 + V7, que se puede sustituir por el número entero 
próximo mayor 4. 

De los numerosos métodos existentes de acotación superior de 
las raíces positivas expondremos solamente el método de Newton. Este 
método es más complicado que el expuesto anteriormente, pero, no 
obstante, da ordinariamente, muy buen resultado. 

Sea dado un polinomio / (x) de coeficientes reales y con el coefi- 
ciente superior positivo ay. Si para z = c, el polinomio f (x) y todas 
sus derivadas sucesivas f' (x), f” (2), . . ., 16 (x) toman valores positivos, 
el número c es una cota superior de las raíces positivas. 

En efecto, según la fórmula de Taylor (véase el $ 23), 


ID= 0430 rey 0, 


entonces, como 


2 


Vemos, que si z>c, el segundo miembro será un número estricta- 
mente positivo, es decir, tales valores de z no pueden ser raices 
de f (x). 

Al buscar el número correspondiente c, para un polinomio f (2) 
dado, es conveniente obrar del modo siguiente. La derivada /™ (2) 
= nlay es un número positivo, de donde, el polinomio /0—1 (z) es 
una función creciente de z. Por consiguiente, existe un número c, 
tal, que para z>ci la derivada /0—0 (z) es positiva. De esto se 
deduce que para z>c,, la derivada /'—2) (zx) es una función crecien- 
te de z, por lo cual, existe un número cz tal (cz >c), que para 2 > cz, 
la derivada f"—=2) (z) también es positiva. Continuando de este 
modo, llegaremos por fin al número buscado c. 
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Apliquemos el método de Newton al polinomio k (z) examinado ante- 
riormente. 
h (z) 


—5154- 817123, 


W (2) =514- 819 —152% 4167 
h” (+) 2019 2422302 +16, 
le (2) =6027 | 48r —30, 
NY (2) = 1207: 48, 
hY (2) =120. 


Fácilmente se comprueba (aunque sea por ol método de Horner), que todos estos 
polinomios son positivos para z= 2. Por lo tanto, el número 2 es una cota 
superior de las raíces positivas del polinomio A (z), resultado que es mucho más 
exacto que los obtenidos por otros método: 

Para hallar una cota inferior de las raíces negativas del polinomio 4 (2), 
veamos ol polinomio a(z) = —h (—2)*. Como 


511813157? — 161 —7, 
30716, 
6012487 —30, 

Pl” (2) =120r 48, 

PY (e) =120, 
y todos estos polinomios son po: 


¡vos para z = á, lo que fácilmente se com- 

prueba, el número 4 es una cota superior de las raices positivas de qa (z), de 

dondo, el número —4 es una cota inferior de las raíces negativas de h (2). 
Examinando, finalmente, los polinomios 


i 


q ()= —x0h (5 =315 274809451221 


Ya ()=—25h (-2) 315718818502 2r 41, 


y aplicando de nuevo el método de Newton, para las cotas superiores de las rai- 
tes positivas de estos polinomios hallamos los números 1 y 4, respectivamente; 


de aquí el número -+ = 1 es una cota inferior de las raíces positivas del poli- 


nomio » (z); el número — 4 es una cota superior do las raíces negativas de éste. 
Por lo tanto, las raíces positivas del polinomio A (z) están comprendidas 
entre los números 1 y 2, y las raíces negativas, entre los números —4 y — -7 - 


Esto resultado concuerda perfectamente con lo hallado antes al examinar la 
gráfica. 


* Aquí tomamos —h (—z) en lugar de h (—z), porque para la aplicación del 
método de Newton, ol coeficiente superior tiene que ser positivo. Naturalmente, 
esto cambio de signo no influyo en las raíces del polinomio qa (2). 


N 
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$ 40. Teorema de Sturm 


Ahora estudiaremos el problema sobre el número de raíces reales 
que tiene un polinomio / (z) de coeficientes reales. Mas, nos interesará 
tanto el número total de las raíces reales como los números de las 
raíces positivas y negativas por separado y, en general, el número 
de raíces comprendidas entre dos números dados a y b. Existen 
unos cuantos métodos para la averiguación del número exacto de 
raíces, siendo éstos demasiado complicados; entre ellos, el más 
sensillo es el método de Sturm que se expondrá a continuación. 

Introduzcamos primero una definición que se utilizará también 
en el párrafo siguiente. 


Sea dado un sistema finito ordenado de números reales diferen- 
tes de cero, por ejemplo, 


ES 3,4 1 a) 
signos de estos números: 
h t c em m e hs > e 


Observamos que en el sistema (2) figuran cuatro veces signos con- 
trarios consecutivos. En virtud de esto, se dice que el sistema orde- 
nado (1) presenta cuatro variaciones de signo. Naturalmente, el 
número de variaciones de signo puede ser calculado para cualquier 
sistema finito ordenado de números reales diferentes de cero. 

Consideremos ahora un polinomio f (x) de coeficientes reales 
y supongamos que éste carece de r múltiples, pues, en caso 
contrario, se le podría dividir por el máximo común divisor del mismo 
y su derivada, Un sistema finito ordenado de polinomios, no nulos, 
de cooficientes reales 


10=100, Ao. fala), > 


se lama sistema de Sturm del polinomio f (z) si s 
condiciones siguientes: 

1) Los polinomios consecutivos del sistema (3) no tienen raíces 
comunes. 

2) El último polinomio f, (x) no tiene raíces reales. 

3) Si æ es una raíz real de uno de los polinomios intermedios 
tn (x) del sistema (3), 1 s —1, entonces, fr- (4) y fra (a) 
tienen diferente signo. 

4) Si œ es una raíz real del polinomio f (2), el producto / (x) /, (2) 
cambia su signo de menos a más, cuando al erecer x pasa por el 
punto a. 

El problema de la existen 
polinomio se estudiará más ade! 


h(a) (3) 


cumplen las 


tema de Sturm para cualquier 
te; ahora. suponiendo que f (x) 


252 Cap. IX Cálculo de las raíces de los polinomios 


posea tal sistema, señalaremos el modo de utilizarlo para averiguar 
el número de raíces reales. 

Si el número real c no es raíz del polinomio dado f (z) y (3) es el 
sistenia de Sturm de este polinomio, tomamos el sistema de núme- 


ros reales 
He), fale), fale) ---. fate), 
eliminamos en éste todos los números iguales a cero, y designa- 
“mos con W (c) el número de variaciones de signo que presenta el 
istema obtenido; diremos que W (c) es el número de variaciones de 
signo que presenta el sistema de Sturm (3) del polinomio f (z) para x =¢ * 
Subsisto el siguiente 
„Teorema de Sturm. Si los números reales a y b, a < b, no son 
raíces del polinomio f (z), el cual carece de raíces múltiples, entonces 
W (a)> W (b), y la diferencia W (a) — W (b) es igual al número 
de raíces reales del polinomio f (x) comprendidas entre a y b. 

Por lo tanto, para la determinación del número de raices reales 
del polinomio / (2) comprendidas entre a y b (recordamos que, por 
hipótesis, / (2) no tiene raíces múltiples), sólo hay que averiguar 
en cuánto disminuye el número de variaciones de signo que presenta 
el sistema de Sturm de este polinomio al pasar del valor a al valor b. 

Para la demostración del teorema, veamos cómo cambia el 
número W (z) al crecer z. Mientras z no pase por alguna raíz de 
alguno de los polinomios del sistema de Sturm (3), los signos 
de los polinomios de este sistema no cambiarán y no variará el 
número W (2). En virtud de esto, y también debido a la condición 
2) de Ja definición del sistema de Sturm, no queda más que examinar 
dos casos: el paso de z por una raíz de uno de los polinomios inter- 
medios fy (2), 1<k <s — 1, y el paso de z por una raíz del mismo 
polinomio / (z). 

Sea æ una raíz del polinomio fy (z), 1<k<s —1. Entonces, 
por la condición 1), fa- (æ) y Jas: (a) son diferentes de cero. Por 
consiguiente, se podrá hallar un número positivo e, posiblemente 
muy pequeño, de tal modo que en el intervalo (4 —e, æ + e) los 
polinomios fh-1 (2) Y /x+, (Z) no tengan raíces, conservando por ello 
constantes los signos, que serán además distintos, por la condición (3). 
De esto se deduce que cada uno de los sistemas de números 


fnr- (a— e), fala — e), frn (2—8), (4) 
hiaila+e), falate), fu (a +e) (5) 


prensentan exactamente una variación de signo, independientemente 
de los signos que tengan los números fy (au — €) y fa (a + e). Por 


Naturalmente, las variaciones de signo que presenta ol sistema de Sturm 
de un polinomio /() no tiene nada de común con la variación de signo del mis- 
mo polinomio f (z), debida al paso de z por una raíz de este polinomio. 


$ 40. Teorema de Sturm 253 


ejemplo, si en el intervalo considerado f}; (z) es negativo y fa- (2) 
es positivo, y si fa (a — e) > Ô, fa (a + e) <0, a los sistemas (4) 
y (5) les corresponderán los sistemas de signos: 


- $3 ==. ++ 


Por lo tanto, al pasar z por una raíz de uno de los polinomios inter- 
medios del sistema de Sturm, la variación de signos en este sistema 
sólo puede trasladarse, mas no podrá aparecer de nuevo ni desa- 
parecer, por lo que durante tal paso el número W (z) no variará. 
Supongamos, por otra parte, que æ es una raíz del mismo polino- 
mio f(z). Según la condición 1), en este caso œ no será raíz 
de f, (£). Por consiguiente, existe un número positivo e tal, que 
el intervalo (u — e, a + e) no contiene raíces del polinomio fy PAN 
por lo cual este último m: 
Si este signo es positivo, en virtud de la condición 4), al pasar £ 
por æ, el mismo polinomio f (z) cambia el signo de menos a más. 


atiene constante el signo en este intervalo. 


es decir, f (a — e) < 0, f(a + e) >0. Luego, a los sistemas de 
números 

fla—e), h(a—e) y fare), flat e) (6) 
les corresponden los sistemas de signos 


TE Y Es 
o sea, en el sistema de Sturm se pierde una variación. Si el signo 
de fi (1) es negativo en el intervalo (a — e, a — e), de nuevo en 
virtud de la condición 4), el polinomio f (x) cambia el signo de más 
a menos al pasar z pora, o sea, f (a — e) > 0, f (a + e) < 0; a los 
sistemas de números (6) les corresponden ahora los sistemas de signos 
te US R 
es decir, en el sistema de Sturm se pierde de nuevo una variación. 
Por lo tanto, el número W (zx) varía (al crecer x) solamente cuando x 
pasa por una raíz del polinomio f (x), disminuyendo exactamente, en 
este caso, en una unidad. 
Naturalmente, con esto queda demostrado el teorema de Sturm. 
Para aplicar este teorema a la averiguación del número total de 
ícos reales de un polinomio f (z), es suficiente tomar por a el límite 
inferior de las raíces negativas y por b, el límite superior de las 
raíces positivas. Sin embargo, es más fácil obrar del modo siguiente. 
En virtud del lema demostrado en el $ 23, existe un número positivo 
N, posiblemente muy grande, tal que para | 2 | > N los signos de 
todos los polinomios del sistema de Sturm coinciden con los sign 
de sus términos superiores. En otras palabras, existe un valor posi 
tivo tan grande de la indeterminada z, que los signos de los valores 
correspondientes de todos los polinomios del sistema de Sturm 
coinciden con los signos de sus coeficientes superiores; este valor 
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de z, cuyo cálculo no es necesario, se designa convencionalmente 
con el símbolo co. Por otra parte, existe un número negativo z, cuyo 
valor absoluto es tan grande que los signos de los valores correspon- 
dientes de los polinomios del sistema de Sturm coinciden con los 
signos de sus coeficientes superiores para los polinomios de grado par, 
y son contrarios a los signos de los coeficientes superiores para los 
polinomios de grado impar; convengamos en designar este valor 
de x mediante —oo. Está claro que en el intervalo (—0o, 00) están 
contenidas todas las raíces reales de todos los polinomios del sistema 
de Sturm y, en particular, todas las raíces reales del polinomio / (2). 
Aplicando el teorema de Sturm a este intervalo, se halla el número 
de estas raíces; la aplicación del teorema de Sturm a los intervalos 
(—oo, 0) y (0, œ) proporciona el número de raíces negativas y el 
número de raíces positivas del polinomio f (2), respectivamente. 
No queda más que demostrar que cualquier polinomio f (z) de 
coeficientes reales que no tenga raices múltiples posee un sistema de 
Sturm. Entre los diversos métodos que s 
ción de tal sistema expondremos el m 
== j’ (x), con lo que se garantiza el cumplimiento de la condi 
de la definición del s . En efecto, si œ es una raíz 
real del polinomio / (+), se tiene /’ (2) + 0. Si f’ (a) > 0, entonces 
f' (2) > 0 en un entorno del punto æ. Por lo tanto, al pasar £ por æ, 
} (2) cambia el signo de menos a más; esto mismo se cumplo también 
para el producto / (z) fı (2). Razonamientos análogos son válidos 
también para el caso en que f’ (a) < 0. Se divido luego / (z) por 
fı (x) y el residuo de esta división, tomado con signo contrario, se 


toma por fa (2): 
$ (æ) = fi (2) qm (2) — fe (2). 


En general, si ya se han hallado los polinomios fn- (2) y fr (2), el 
polinomio /1+, (z) será el residuo de la división de /,-1 (2) por 
Ín (2), tomado con signo, contrario: 


naa (2) = fa (2) qu (2) — fass (2). (7) 


El método expuesto se diferencia del algoritmo de Euclide: 
aplicado a los polinomios.f (z) y f’ (z), solamente en que cada vez se 
cambia el signo al residuo, y la división consiguiente se efectúa ya 
por este residuo, tomado con el signo contrario. Como al buscar el 
máximo común divisor este cambio de signos no importa, nuestro 
proceso terminará en cierto f, (z), que será el máximo común divisor: 
de los polinomios f (z) y f” (z); además, como f (x) no tiene raíces 
múltiples, o sea, es primo con f' (z), resulta que en realidad f; (z) 
será un número real diferente de cero. 

De aquí que el sistema construido de polinomios 


F) = fola), F(E) = fila), fala), + fe (2) 


ial. Hagamos f; 
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también satisface a la condición 2) de la definición del sistema de 
Sturm. Para demostrar que se cumple la condición 1), supongamos 
que los polinomios consecutivos fa (z) y fr+ı (2) tienen una raíz 
común æ. Entonces, por la igualdad (7), œ también es raíz del poli- 
nomio fa-1 (z). Pasando a la igualdad 


Ihr (2) = fa- (2) Que (2) — fa (2), 


resulta que æ es también raíz de /,-» (z). Continuando de este modo, 
hallamos que œ es una raíz común de f (z) y f’ (2), lo que contradice a 
las hipótesis hechas. Finalmente, el cumplimiento de la condición 3) 
es consecuencia inmediata de la igualdad (7), pues, si f (a) = 0, 
resulta fj-1 (a) = —fn+1 (2). 


Apliquemos el método de Sturm al polinomio 
(2) =254-218 54381773, 
examinado en el párrafo anterior. Aquí vo comprobaremos previamente que h (x) 
carece de raices múltiples, puesto que el método de construcción del sistema de 
Sturm, sirve a la vez para comprobar si el polinomio y su derivada son primos 
entre si, E E 
Mallemos el sistema de Sturm h (z) aplicando el método indicado. 
Mas, a diferencia del algoritmo de Euclides, en el proceso de división multi- 
plicaremos y simplificaremos solamente por números positivos arbitrarios, 
puesto que los signos de los residuos desempeñan un papel fundamental en el 
método de Sturm. Obtendremos el sistema siguiente 
Ma) 36 52785134 84874 
h ()=5x4., 8791572 ¡1G2—7, 


hy (a) 6679 — 1501217261, 


ha (2) 352 -i 72, 
h (z)- z —8 486 093, 
hs (2) - 


Determinemos los signos de los polinomios de este sistema para z = — 
y z= co, para lo cual, según lo indicado, se deben observar solamente los 
signos de los coeficientes superiores y los grados de estos polinomios. Resul- 
ta la tabla: 


f cá PEET RENN 

fro norimo |ui] Número, do variaciones 
ahleh > 
ae 


Por lo tanto, al pasar z de —oo a œ, el sistema de Sturm pierde tres varia 
ciones de signo y, por esto, el polinomio A(z) tiene exactamente tres raíces 
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reales. De aquí vemos que, al construir la gráfica de este polinomio en el 
párrafo anterior, no habíamos perdido ninguna rai 
Apliquemos el método de Sturm a otro polinomio más si 


el polinomio 
Í (2) =z? 4 3r? 


Hallemos el número de sus raíces reales y también las cotas enteras entre las 
está comprendida cada una de estas raíces, sin construir previamente la grái 
ea del mismo. 
El sistema de Sturm de este polinomio es 
OE RET E 
hi3: 6x, 


Lalo) 224. 


ple. Sea dado 


Hallomos el que presenta este sistema para 


2=-0 y z 
20 tol rta lo Biei nana 
=o|-|+|- 3 
EN ilti e o 


polinomio f(x) tiene tres raices reales, Para determinar 


más exactamente de estas raíces, continuemos la tabla anterior: 


ta | 101] saco | tata) | Número, de variaconos 
z =|+|-|+* 3 
z=—2| 4+|0|-|+ 2 


+ 
I 
| 

K 


at l+ + [+ [+ o 


Por lo tanto, el sistema de Sturm del polinomio f (z) pierdo una variación 
de signo cada vez que z pasa de — 2, de —t a O y de Oat. Luego, 
las raíces a, æa y az del polinomio satisfacen a las desigualdades: 


=3<4<—=2% —1<%<0 0<a<t. 
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El teorema de Sturm resuelve por completo el problema del 
número de raíces reales de un polinomio. No obstante, su defecto 
fundamental consiste en que los cálculos necesarios para la cons- 
trucción del sistema de Sturm son muy engorrosos, de lo cual se 
puede convencer el lector realizando todos los cálculos respectivos 
en el primero de los ejemplos considerados anteriormente. En virtud 
de esto, se demostra! ahora dos teoremas que no proporcionarán 
el número exacto de raíces reales, sino solamente una cola superior 
de este número. Después de haber hallado mediante la gráfica una 
cota inferior para el número de raíces reales, la aplicación de estos 
teoremas dará la posibilidad de hallar a veces el número exacto de 
raíces reales sin recurrir al método de Sturm. 

Sea dado un polinomio f (x) de n-ésimo grado, de coeficientes 
reales, que puede tener raíces múltiples. Consideremos el sistema 
formado por sus derivadas sucesivas 


HO JO, PD, FO, JUDO, 10, u) 


en el cual la última es igual al coeficiente superior ay del poli- 
nomio f (x), multiplicado por n!, conservando por consiguiente 
constante el signo. Si el número real c no es raíz de ninguno de los 
polinomios del sistema (1), el número de variaciones de signo que 
presenta el sistema ordenado de números 


HO Pe), P) aa POMO), 10). 

(o). 

puede considerar la función $ (2), definida para 
ulan a ninguno de los polinomios del siste- 


se designará con 

Por lo tanto 
los valores de z que no a 
ma (1). 

Veamos cómo varía el número $ (z) al crecer z. Mientras z no 
pase por una raíz de alguno de los polinomios (1), el número $ (z) 
no puede variar. En virtud de esto, tenemos que examinar dos caso 
el paso de z por una raíz del polinomio f (2) y el paso de z por una 
raíz de una de las derivadas {Ù (2), <k- n — 1. 

Sea œ una raíz múltiple de orden 2 del polinomio / (z). 1>1, 
o sea, 


1) -Fla)=... =[0-0(0)=0, $0 (a) +0, 


Sea e un número positivo tan pequeño que el intervalo (a —+ 
ae) no contenga raíces de los polinomios f(z), f’ (2), - 

- a JO (2) diferentes de a y no contenga tampoco ninguna raíz 
del polinomio /Ù (z). Demostremos que en el sistema de números 


A O IS 
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dos números consecutivos cualesquiera tienen signos contrarios, 
mientras que todos los números 


Hate), Flare), Sa €). fOe) 


tienen un mismo signo. Como cada uno de los polinomios del siste- 
ma (1) es la derivada del polinomio anterior, no nos queda más que 
demostrar que si x pasa por una raíz æ del polinomio f (z), entonces, 
independientemente del orden de multiplicidad de esta raíz, f (+) 
yf (2) tenían signos contrarios antes del paso, y después del paso sus 
signos coinciden. Si / (4 —e) > 0, entonces f (z) decrece en el inter- 
valo (a —e, a), de donde, f’ (a — e) < 0; si f (a —*) <0, entonces 
Í (z) crece y, por lo tanto, f' (4 —e) > 0. Por consiguiente, en 
ambos casos los signos son distintos. Por otra parte, si f (a + e) > 0, 
entonces f (z) crece en el intervalo (x, e > e) y f (a + e) > 0; 
análogamente, de f(a +e)<0 se deduce que f' (æ + e) < 0. 
Por lo tanto, después de pasar por la raíz æ, los signos de f (x) y /' (2) 
tienen que coincidir. 

De lo demostrado se deduce que al pasar z por una raíz de orden 
1 del polinomio f (z), el sistema 


1), Ta) 


pierde Z variaciones de signo. 
Sea ahora æ una raíz de las derivadas 


PO qa), (D(a), cc, ORD (2), AS hn 


no siendo raíz de /U—1) (2) y tampoco de [0+1) (2). Por lo demostrado 
anteriormente, el paso de z por æ da lugar a una pérdida de £ varia- 
ciones de signo en el sistema: 


FW (0), JOD (a), +, JD (2), JUH (a). 


Por cierto, este paso puede crear una nueva variación de signo entro 
J0—0 (2) y 10 (x); sin embargo, como />1, al pasar z por æ, el 
número de variaciones de signo en el sistema 


JO (2), $00 (2), fH (z), ..., JOH-9 (2), JOH (2), 


o no varía, o disminuye. Pero, puede disminuir solamente en un 
número par, pues los polinomios /*—® (z) y /*+) (x) no cambian sus 
signos al pasar z por el valor æ. 

De los resultados obtenidos se deduce que, si los números a y b, 
a< b, no son raíces de ninguno de los polinomios del sistema (1), el 
número de raíces reales del polinomio f (z), comprendidas entre a y b 
y contadas cada una de ellas tantas veces como lo indique su orden de 
multiplicidad, es igual a la diferencia S (a) — S (b) o es menor que 
esta diferencia en un número par. 


s F-D (2), $0(x) 


l>1, 
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Para debilitar las restricciones impuestas a los números a y b, 
introduzcamos las siguientes notaciones. Supongamos que el número 
real e no es raíz del polinomio f (z), pudiendo ser, posiblemente, raíz 
de otros polinomios del sistema (1). Designemos con $ + (c) el número 
de variaciones de signo que presenta el sistema de números 


HO, PO, FLO, .-.. A9 (e), 09 (0) 2) 
calculado del modo siguiente: si 


10 (0) = [040 e=... = faH- (e) =0, 0) 


pero 
-O (e)#0, J+ (c) 40, (4) 


entonces se supone que /0 (e), /*+1) (e), .. ., f®++0 (c) tienen el mis- 
mo signo que /4+6 (c); por supuesto, esto equivale a suponer que al 
calcular el número de variaciones de signo que presenta el sistema (2), 
los ceros se han eliminado. Por otra parte, designemos con S- (c) el 
número de variaciones de signo que presenta el sistema (2), calculado 
del modo siguiente: cumpliéndose las condiciones (3) y (4), se supone 
que f0ceD (e), O<i<1—4, tiene el mismo signo que /0+0 (c), 
si la diferencia 1 — ies par, y el signo contrario, si esta diferencia 
es impar. 

3i se quiere determinar ahora el número de raíces reales del polino- 
nomio f (z), comprendidas entre a y b, a < b, donde a y b no son 
raíces de f (z), pudiendo ser, posiblemente, raíces de otros polinomios 
del sistema (1), se obra del modo siguiente. Sea e tan pequeño que el 
intervalo (a, a + 2e) no contenga raíces del polinomio f (z) y tampo- 
co raíces diferentes de a de los demás polinomios del sistema (1); 
sea, por otra parte, y tan pequeño que el intervalo (b — 21, b) no 
contenga raíces de f (x) y tampoco raíces, diferentes de b, de los 
demás polinomios del sistema (1). Entonces, el número buscado de 
raíces reales del polinomio f (z) será igual al número de raíces 
reales de este polinomio, comprendidas entre a + e y b —1, o sea, 
por lo demostrado anteriormente, será igual a la diferencia S (a + 
+ e) — S (b — n) oserá menor que esta diferencia en un número 
par. Mas, fácilmente se observa que 


S(a+e)= S, (a), S(b—n) =S- (b). 


Con esto queda demostrado el siguiente 

Teorema de Budan — Fourier. Si los números reales a y b, a < b, 
no son raices del polinomio f (x) de coeficientes reales, el número de 
raíces reales de este polinomio, comprendidas entre a y b, y contadas 
cada una de ellas tantas veces como indique su orden de multiplicidad, 
es igual a la diferencia S, (a) — S- (b) o es menor que esta diferencia 
en un número par. 


17° 
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Designemos con el símbolo œ un valor positivo tan grande de la 
indeterminada x que los signos de los valores correspondientes de 
todos los polinomios del sistema (1) coincidan con los signos de sus 
coeficientes superiores. Como estos coeficientes son sucesivamente 
los números ao, nao, n (n — 1) ao, - - -+ 2 lao, cuyos signos coinciden, 
resulta S (00) S- (œ) O. Por otra parte, como 


FO) am FO) ani, PO) anat, 
1700) = an3, o. 1090) = aont, 


donde ao, 41 - .., aa son los coeficientes del polinomio f (z), 
resulta que S+ (0) coincide con el número de variaciones de signo que 
presenta el sistema de coeficientes del polinomio / (z), en el cual no 
se cuentan los coeficientes iguales a cero. Así, aplicando el teorema 
de Budan-—Fourier al intervalo (0, co), resulta el teorema siguiente: 

Teorema de Descartes. El número de raíces positivas de un polino- 
mio f (x), contadas cada una tantas veces como indique su orden de 
multiplicidad, es igual al número de variaciones de signo que presenta 
el sistema de coeficientes de este polinomio (los coeficientes iguales a cero 
ho se cuentan) o es menor que este número en un número par, 

Está claro que para la determinación del número de raíces nega- 
tivas del polinomio f (z) es suficiente aplicar el teorema de Descartes 
al polinomio f (—z). Naturalmente, si en este caso ninguno de los 
coeficientes del polinomio f (zx) es igual a cero, a las variaciones de 
signo que presenta el sistema de coeficientes del polinomio f (—z) 
corresponden permanencias de signo que presenta el sistema de 
coeficientes del polinomio f (z), y viceversa. Por lo tanto, si un 
polinomio f (2) no tiene coeficientes iguales a cero, el número de sus 
raíces negativas (contadas con su orden de multiplicidad) es igual al 
número de permanencias de signo que presenta el sistema de coeficientes 
o es menor que éste en un número par. 

He aquí otra demostración más del teorema de Descartes que 
no se basa en el teorema de Budan — Fourier. Demostremos pri- 
mero el lema siguiente: 

Si c> 0, entonces el número de variaciones de signo que pre- 
senta el sistema de coeficientes del polinomio f (z), es menor en un 
número impar que el número de variaciones de signo que presenta 
el sistema de los coeficientes del producto (x —c) f (2). 

En efecto, encerrando entre paréntesis los términos consecutivos 
de un mismo signo, expresemos el polinomio f (z), cuyo coeficiente 
superior ay se supone positivo, del modo siguiente: 


F=" o E bata) 
+A (ast n H bana" 


(5) 
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Aquí ay >0, a, >0, ..., 4,>0, mientras que bi, bz, -+o Ó, 
son positivos o iguales a cero; pero b,+, se supone estrictamente posi: 
tivo, de modo que z', donde £>0, es la potencia mínima de la 
indeterminada z que figura en el polinomio f (z), con un coeficiente 
diferente de cero. La expresión 


ao" +.. 4 bart) 


puede constar eventualmente de un solo sumando; esto sucede cuando 
kı +14 =n. Observaciones análogas se refieren también a otras 
expresiones entre paréntesis que figuran en la fórmula (5). 
Escribamos ahora el polinomio igual al producto (z — c) f (2), 
en el que separaremos solamente los términos que contengan las 


potencias n 4- 1, ki H1, .... ke +1 y £ de la indeterminada z. 
Resulta 
(20) f (2) =(a 4.) (at cdo 


lae — ebaz), (6) 


-e +(—1) (0° 
donde aj- a; + cb, i Ll y por lo cual, como 
c >Q, todas las aj son estrictamente positivas. Por lo tanto, el 
sistema de coeficientes del polinomio / (z) presenta entre los tér- 
minos az” y —a,z": ( y también entre los términos —a,2%1 y agr'a, ete), 
una variación de signo, y el polinomio (x —c) f(x) presenta 
entre los términos correspondientes a agz"+! y —ajaladl (respectiva 
mente, entre los términos —a 244 y a,z*2+1, etc.) una variación de 
signo o más, pero en este último caso, inevitablemente, en un número 
par más. Aquí no nos interesan los Ingares exactos de estas variacio- 
nes de signo; por ejemplo, puede ocurrir que el coeficiente de z'a+2 
en (6) sea negativo, igual que el coeficiente —a; y que, por esto, 
estos dos coeficientes consecutivos no presenten variación de signo, 
es decir, que entre los paréntesis primeros las variaciones de signo 
stén situadas antes. Obsérvese ahora que los últimos paréntesis en 
(5) no presentaban ninguna variación de signo, mientras que los 
últimos paréntesis en (6) si presentan, y, además, un número impar de 
ellas. Téngase en cuenta que los últimos coeficientes de los polino- 
mios f (2) y (z — e) f (z), diferentes de cero, o sea, (—1)* bs 
y (-1)1b,410, tienen signos contrarios. Por lo tanto, al pasar de 
Í (z) a (x —c) f (z) el número total de variaciones de signo que 
presenta el sistema de coeficientes aumenta inevitablemente en un 
número impar (naturalmente, la suma de unos cuantos términos, 
de los cuales uno es impar y los demás son pares, es impar). El lema 
está demostrado. 

Para demostrar el teorema de Descartes, designemos con 
Qi, da, -s % todas las raíces positivas del polinomio f (z). 
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Por lo tanto, 
f (£)= (1—0) (2—az) --- (222) 9 (2), 


donde «q (x) es un polinomio de coeficientes reales sin raíces reales 
positivas. De aquí se deduce que el primero y el último coeficiente 
del polinomio y (z), diferentes de cero, son de un mismo signo, o sea, 
el sistema de coeficientes de este polinomio presenta un número 
par de variaciones de signo. Aplicando ahora sucesivamente el lema 
demostrado anteriormente a los polinomios 


pta), (z—a) p (2), (1— a) (24) q (0), f (2), 


se obtiene que el número de variaciones de signo que presenta el 
sistema de coeficientes aumenta cada vez en un número impar, © sea, 
en una unidad más un número par; por esto, el número de variaciones 
de signo que presenta el sistema de coeficientes del polinomio f (z) 
es mayor que el número % en un número par. 


Apliquemos los teoremas de Descartes y de Budan-Foutier al polinomio 

examinado anteriormente: 
h(2)=254 204511; 81872. 

El número de variaciones de signo que presenta el sistema de 
os igual a tros y, por consiguiente, según el teorema de Descarte 
tener una o tres raices positivas. Por otra parte, À (x) no tiene coeficientes igua- 
les a coro, y como el sistema do coeficientes presenta dos permanencias de 
signo, resulta que A (z) o bien tiene dos raices negativas, o bien, no tiene ningu- 
na, Comparando con los resultados obtenidos antes mediante la gráfica, vemos 
que dos es ol número exacto de raíces negativas de nuestro polinomio. 

Para lu determinación exacta del número de raices positivas, aplicaremos 
ol teorema de Budan-Fourier al intervalo (1, œ), pues, en el $ 39 ya se había 
demostrado quo í es una cota inferior de las raíces positivas del polinomio h (z). 
Las derivadas sucesivas de h (z) también fueron halladas en el $ 39. Hallemos 
sus signos para 2 =1 y z= o: 


oliciontes 
h (z) puedo 


nia [w 12] o MY jay (a) | Nimero de variaciones 
aeb 
+| + | + | + | + | 4 | o 


De aquí se deduce, que el sistema de derivadas, al pasar z de 1 a co, pierde una 
variación de signo, por lo que, A(z) tiene exactamente una raíz positiva. 

Obsérvese que, en general, al buscar el número de raíces reales 
de un polinomio, se debe comenzar con la construcción de la gráfica 
y aplicar- los teoremas de Descartes y Budan-Fourier; solamente 
en casos muy extremos se debe pasar a construir el sistema de Sturm. 
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El teorema de Descartes se puede precisar cuando se sabe previa- 
mente que todas las raíces del polinomio son reales, como esto tiene 
lugar, por ejemplo, en el caso del polinomio característico de una 
matriz simétrica. Resulta que: 

Si todas las raices del polinomio f (x) son reales y el término indepen- 
diente es diferente de cero, el número k, de raíces positivas de este pol 
nomio es igual al número s, de variaciones de signo que presenta el 
sistema de sus coeficientes, y el número ka de raíces negativas es igual al 
número s> de variaciones de signo que presenta el sistema de coeficientes 
del polinomio f (—x). 
efecto, en estas con 


(7) 


donde n es el grado del polinomio f(z), y, según el teorema de 


(8) 
Demostremos que 
1 52<n. (9) 


La demostración se hará por el método de inducción sobre m, pues- 
to que, como ay 0, a, 0, para n= 1 presenta variación de 
signo solamente uno de los polinomios 


(2) =490 a f(—2) 


— at yy 


o se 


en este caso s © sa = 1. Supong 
ya está demostrada par 


os que la fórmula (9) 
los polinomios de grado menor que n. Si 


f (£) ay] anaia! bs 


donde LEn—1, ang 0, hacemos 


glz) art... 


Entonces 
1) aue" +g (2), H(—2)=(— at" g(—2). 
Si sí y s} son los números de variaciones de signo que presentan los 


sistemas de coeficientes de los polinomios g (x) respectiva- 
mente, entonces, según la hipótesis de inducción (claro que / +1), 


Sil — n —1. entonces, solamente uno de los polinomios f (+) o f (— 
presentará una variación de signo en el primer siti 
Í (2), entre a, y dy 


) 


- para 


264 Cap. IX Cálculo de las raíces de los polinomios 


Sil<n —2, entonces, cada uno de los polinomios f (z), f (—z) puede 
presentar variaciones de signo en los primeros lugares, pero, en este 
caso, 


s+s<s +5 42<142 H2-=m. 


Confrontando (7), (8) y (9), se obt 
Sw ke 


como se quería demostrar. 
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Los métodos expuestos en los párrafos anteriores permiten efes 
tuar la separación de las raíces reales de un polinomio f (z) de coefi- 
cientes reales, es decir, indicar para cada raíz las cotas entre las que 
la raíz está comprendida. Si estas cotas son bastante estrechas, cual- 
quier número comprendido entre ellas se puede tomar por valor 
aproximado de la raíz buscada. Por lo tanto, después de establecer, 
por el método de Sturm (o por otro método más sencillo), que entre 
los números racionales a y b está comprendida una sola raíz del 
polinomio / (z), se plantea el problema de aproximar estas cotas 
entre sí, de modo que las nuevas cotas a” y b' tengan un número 
prefijado de sus primeras cifras decimales iguales; con esto, la raíz 
buscada quedará calculada con la exactitud dada. 

Existen muchos métodos que permiten hallar con suficiente rapi- 
dez el valor aproximado de la raíz con la exactitud deseada. Aquí 
se indicarán dos de ellos, los que teóricamente son más simples 
y generales; al aplicarlos simultáneamente se obtiene el resultado con 
una rapidez satisfactoria. Es menester observar que los métodos que 
se van a exponer, no sólo pueden aplicarse a los polinomios, sino 
también a clases más amplias de funciones continuas. 

A continuación se supondrá que æ es una raíz simple del polino- 
mio f (z) (ya que podemos librarnos siempre de las raíces múltiples) 
y que la raíz a ya está separada de las demás raíces por las cotas 
ayb,a<a< b; en particular, de aquí se deduce que f (a) y / (b) 
tienen signo contrario. 

Método de interpolación lineal (llamado también regula falsi). 
Por valor aproximado de la raíz æ se podría tomar, por ejemplo, la 


semisuma de las cotas a y b, > el punto medio del inter- 


valo limitado por los puntos a y b. Sin embargo, es más natural 
suponer que la raíz está más cerca de la cota que corresponde a un 
valor absoluto menor del polinomio. El método de interpolación 
lineal consiste en que se toma por valor aproximado de la raíz œ 
el número c que divide el intervalo (a, b) en partes proporcionales 
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a los valores absolutos de los números f (a) y f (b), o sea, 
PRE n 
OSITO 
el signo menos del segundo miembro es debido a que f (a) y / (bY 
tienen signos contrarios. De aquí que 
bi (a)—aJ(0) 
—TO-10) * o 

Como muestra la fig. 10, el método de interpolación lineal con- 

siste en que en el intervalo (a, b) la curva y = f (x) se sustituye por 
la cuerda que une los puntos A (a, 
F(a) y B(b, f(b)), tomando por y 
valor aproximado de la raíz æ la abscisa 
del punto de intersección de esta cuerda 
con el eje z. 

Método de Newton. 
raíz simple del polinomio f (z), se 
tiene f’ (4) 0. Supongamos que ta 

ión f' (a) 0, pues, en 
trario, el problema se redu 
cálculo de la raíz del polinomio f” (x), Fig. 10. 
que es de menor grado que f (z). Supon- 
gamos que el intervalo (a, b) no contiene raíces de f (x) diferentes 
de æ, ni contiene tampoco ninguna raíz del polinomio /' (x) y del 


y y 
B 
adj 
WA- 0 
A 


Fig. 11. Fig. 


polinomio f” (z) *. Por lo tanto, como se deduce del curso de análisis 
matemático, en el intervalo (a, b) la curva y f (z) es monótona 
creciente, o es monótona decreciente; además, en todos los puntos 


* El estrechamiento de las cotas que da lugar a que se satisfaga esta condi- 
ción se consigue ordinariamente sin dificultad alguna, pues los métodos expues- 
tos anteriormente permiten determinar el número de raíces de los polinomios 
T (2) y f* (2) en cualquier intervalo. 
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de este intervalo la convexidad está diri la hacia arriba, o en 
todos los puntos la convexidad está dirigida hacia abajo, Por con- 
siguiente, en la representación de la curva en el intervalo (a, b) 
pueden presentarse cuatro casos, expuestos en las figs. 14—14. 


Fig. 13. Fig. 14. 
Designemos con ay uno de los extremos a o b, en el que el signo 
de j (+) coincide con el signo de /” (2). Como f (a) y f (b) tienen signos 


distintos y /” (x) conserva el signo en t 
puede ser indicado. En Jos ca 


y 


do el intervalo (a, b), tal ap 
s representados en las figs. 11 y 14, 


Fig. 15. 


ay = a; en los otros dos casos, ay — b. Tracemos por el punto de 
abscisa ao, es decir, porel punto de coordenadas (ao, f (20)), la tangen- 
te a la curva y = f (x) y designemos con d la abscisa del punto de 
intersección de esta tangente con el eje z. Las figs. 11 —14 muestran 
que el número d se puede tomar por valor aproximado de la raíz œ. 
Por; consiguiente, el método de Newton consiste en sustituir la 
curva y = f (z) en el intervalo (a, b) por su tangente, trazada en 
uno de los extremos de este intervalo. La condición impuesta a la 
elección del punto ao es esencial: la fig. 15 muestra que omitiendo 


$4 
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esta condición el punto de intersección de la tangente con el eje z 


puede estar muy lejos de ser una aproximación de la raíz buscada. 

Hallemos la fórmula según la cual se busca el número d. Como 
se sabe, la ecuación de la tangente a la curva y f (x) en el punto 
(ao, f (40) se puede escribir en la 
forma 


y— Í (ao) =f (aa) (£ — a0). 
Poniendo aquí las coordenadas (d, 0) 
del punto de intersección de la ta 
gente con el eje z, resulta 

— f (ao) = f' (ao) (d — a 
de donde 


AC) .9 
da 0) 
Si el lector une en las figs. 11 —14 Fig. 16. 


los puntos A y B con cuerdas, obser- 

á que en todos los s métodos de interpolación lineal y de 
Newton dan una aproximación al valor verdadero de la raíz e por 
lados diversos. Por esto, si el intervalo (a, b) satisface a las condicio- 
nes que se piden en el mótodo de Newton, es conveniente combinar 
estos dos métodos. De este modo se obtienen para la raíz unas cotas 
más estrechas; e y d. Si éstas no dan toda’ la exactitud de apro- 
ximación pedida, se les pueden aplicar otra vez más a estos límites 
ambos métodos (véase la fig. 1 . so puede demos 
que este proceso permite calcular verdaderamente la raíz a con la 
exactitud que se desee 


Apliquemos estos métodos al poli 

hir) 62 

considerado en los párral 

Ya sabemos que este poli 

los limites 1 <a Se p 

ado amplias para que los de Newton, apli 

cadas una sola vez, pu resultado. Sin emħargo, los aplic: 
mos para tener un ejemplo de cálculos poco complicados. 

Como ya vimos en or, paraz -1 las 

, h“ (z) toman valores positi 

deduce que el valor z - 1 es, p 


entre 
ema- 


vadas k’ (e), de” (2). 

. Basándose en los resultados del $ 39. 

ra 4" (2), y también para A” (r), una cota pre 
nte, el intervalo (1, 2) no contiene 

licarle ado de Newton. Aden 


h(2)= 
Teniendo en cuenta q 


E kr) 10%, aplicando la 
fórmula (2) 


179 
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Por otra parte, la fórmula (1) da 


109.. 


iguiente, la raiz ay está comprendida entre las colas 
1,092 < 16 


por e 


Arechamiento de s demasiado insignificante 
isfactorio. Claro, a las nuevas cotas obtenidas 
plicar de nuevo nuestros métodos. Sin embargo, sería conve- 
lar desde el principio paraa unas cotas bastante estrechas, porejemplo, 
exactitud de 0,£ e incluso ha y solamente después aplicar 


Hemos obtenido un 
sultado sea 


estos métodos, Naturalmente, esto dal los cálculos se complica- 
sen muchísimo, pero al resolver problemas co los que se necesitan cono- 
cer las raices de un polinomio con bastante exactitud, no hay más remedio 


que actuar de este mo 

Volvamos a examinar nuestro p 
todos los valores de los polinomios y 
la regla de Horner. Como 


hU 0 


Mio 
recen a con 


su raíz ay, Obsérvese que 
nuación se calculan por 


OST, A (LAI)  OOGG2923851; 


se tiene 
13Z0< 13, 


es decir, hemos hallado el valor de 
quemos ahora los métodos de im 


1,30078 -.. 


0, 2061623851 


Apliquemos el método de stas mismas cotas, en donde se 


debe poner ay 1,31, Como 


su tiene 


11.0662923851 


qe 20, 92822405 


Por lo tanto 
1,30678 < a, < 1,3068% 


por consiguiente, poniendo æ; — 1,30681, se comete un error menor que 0,00003. 


ta ahora no hemos demostrado que los métodos expuest 
anteriormente permiten calcular la raíz con la exactitud deseada, 
o sea, no hemos demostrado la convergencia de estos método: 
Demostremos esto únicamente para el método de Newton. 

Supongamos de nuevo que la raíz simple æ del polinomio f (zx) 
está contenida en el intervalo (a, b), siendo éste elegido de la forma 
necesaria para la aplicación del método de Newton. De aquí se dedu- 
ce, en particular, la existencia de unos números positivos A y B 
tales, que en todo el intervalo (a, b) 


IF DISA, |f (2) <B. (3) 
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Hagamos la notación 


y supongamos que 
C(b—a) <i. (4) 


Para que se cumpla esta desigualdad, habrá posiblemente que susti- 
tuir las cotas (a, b) de la raíz œ por otras más estrechas, lo cual no 
influye para que se cumplan las desigualdades (3). Sea ay la cota 
a o b, a la que se debe aplicar el método de Newton. Aplicando la 
fórmula (2), por valores aproximados de la raíz æ obtenemos, sucesi- 
vamente, los números dj, as, +... an, ..., Situados en el inter- 
valo (a, b) y relacionados entre sí por las igualdades 


ar A k= (5) 
Sea 
a-a thr, k=0, (6) 


Entonces 


01 


O=} (a) =f (an) + hrf" (an) +3 f (an + Oha), 


donde 0 < 0 < 1. Debido a las condiciones impuest 
(a, b), f' (aj) + 0, y teniendo en cuenta (5) y (6), r 


hå, f" land Oh) la) Ja) 
> Pia a a— (0— ayy) a— aphan: 
De aquí 

[hans j= hk A Cik he i2, 


Por lo tanto, 


lin] <C 


o bien, como |4p| -[a—ay| <b—a, 
Peres < CHO ap, k=O, (7) 


En virtud de la condición (4), de aquí se deduce que la diferencia hy 
entre la raíz a. y su valor aprorimado ay, obtenido por aplicación reite- 
rada del método de Newton, tiende a cero al crecer le, como se quería 
demostrar. 

Señalemos que la fórmula (7) da una cota del error para la (k + 4)- 
ésima aproximación, lo cual es importante si el método de Newton 
se aplica solo, y no en combinación con el método de interpolación 
lineal. 
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En los cursos de la teoría del cálculo aproximado, el lector podrá 
hallar procedimientos más racionales para realizar los cálculos 
con los métodos expuestos. En estos mismos cursos se puede hallar 
la exposición de muchos métodos de cálculo aproximado de raíces. 
Entre éstos, el más perfecto es el método de Lobachevski (a veces, 
llamado equivocadamente método de Gräffe). Este método permite 
hallar simultáneamente los valores aproximados de todas las raíces, 
incluyendo las imaginarias, sin exigir la deparación previa de ellas; 
no obstante, requiere cálculos muy complicados, Este método se basa 
en la teoría de los polinomios simétricos expuesta en el cap. 11. 


CAPITULO X 
CAMPOS Y POLINOMIOS 


$ 43. Anillos y campos numéricos 


En muchos de los apartados anteriores del curso nos encontrába- 
mos en la situación siguiente: exponiendo un tema, se permitía 
operar, o bien con números complejos arbitrarios, o bien solamente 
con números reales. Pero, después advertimos que los resultados 
obtenidos tienen también valor cuando se consideran solamente 
números reales (o que se generalizan respectivamente, palabra por 


palabra, para el caso de números complejos arbitrarios). Por regla 
general, en todos estos casos se podía observar que la teoría expuesta 


se conservaría enteramente también en el caso en que se permitiese 
tratar solamente con números racionales. Ha llegado ya el momento 
de explicar al lector las causas verdaderas de este paralelismo, 
para exponer el material ulterior en su generalidad natural, es 
decir, en el idioma algebraico usual. Con este fin, introduciremos 
el concepto de campo y también el de anillo. A pesar de ser este 
último un concepto más amplio, en nuestro curso va a desempeñar 
un papel auxiliar. 

Está claro que los sistemas de todos los números complejos, de 
todos los números reales y de todos los números racionales, al igual 
que el sistema de todos los números enteros, poseen la propiedad 
común de que en cada uno de ellos, manteniéndose dentro de los límites 
del mismo sistema, no sólo se puede efectuar la suma y el producto, sino 
también la resta. Esta propiedad de los sistemas numéricos indicados 
los distingue, por ejemplo, del sistema de los números enteros pos 
tivos o de los números reales positivos. 

Todo sistema de números complejos, o, en particular, reales, 
que contiene la suma, la diferencia y el producto de dos cualesquiera 
de sus números, se llama anillo numérico. Por lo tanto, los sistemas 
de todos los números enteros, racionales, reales o complejos, son 
anillos numéricos. Por otra parte, ningún sistema de números pos 
tivos será un anillo, pues, si a y b son dos números positivos 
diferentes, entonces, a — b o b—a será negativo. Un sistema 
cualquiera de números negativos tampoco será anillo, aunque sólo 
sea por el hecho de que el producto de dos números negativos es 
positivo. 
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Con los cuatro ejemplos considerados anteriormente no se agotan 
ni mucho menos los anillos numéricos, Ahora se van a señalar otros 
«ejemplos, cuya comprobación de que el sistema considerado de 
números es verdaderamente anillo, se dejará al lector. 

Los números pares forman un anillo; en general, para cualquier 
número natural n, el conjunto de números enteros divisibles por 
n es un anillo. Los números impares no forman anillo, pues la suma 
de dos números impares es par. 

Es anillo el conjunto de los números racionales cuyos denomina- 
dores, en las expresiones en forma de fracciones irreducibles, son 
potencias del número 2; en particular, a este conjunto pertenecen 
todos los números enteros, pues, y nes irreducibles tienen 
en el denominador el número 1, o sea, dos elevado a la potencia cero. 
En este ejemplo, en Ingar del número 2 se podría tomar, natural- 
mente, cualquier número primo p. En general, tomando cualquier 
conjunto de números primos, finito e incluso infinito, y considerando 
el sistema de los números racionales cuyos denominadores, en las 
expresiones en forma de fracciones irreducibles, pueden dividirse 
solamente por los números primos que pertenecen al conjunto consi- 
derado, se obtiene también un anillo. Por otra parte, el conjunto de 
los números racionales cuyos d ores, en las expresiones en 
fracciones irreducibles no se dividen por el cuadrado de ningún 
número primo, no es un anillo, puesto que la propiedad indicada no se 
conserva al multiplicar. 

Veamos ejemplos de anillos numéricos que no pertenecen entera- 
mente al anillo de los números racionales. El conjunto de los números 
de la forma 


abV2, 0) 


ales arbitrarios, es un anillo; a éste 
los números racionales (cuando 
b = 0), y también el mismo número VĒ (cuando a — 0, b = 4). 
También obtendríamos un anillo, si nos limitásemos a considera 
solamente los números de la forma (1) con coeficientes enteros a, b. 
Claro, en estos ejemplos, en lugar del número J/Zse podría tomar V 3 
o V5, ete. 
El sistema de números de la forma 


donde a y b son números rac 
pertenecen, en particular, tod: 


aby? a 


<on cualesquiera coeficientes racionales (o solamente con enteros 
cualesquiera) a, b, no forma anillo, pues, como fácilmente se com- 
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prueba, el producto del número /2 por sí mismo no puede ser expre- 
sado en la forma (2) *. 
Sin embargo, el sistema de números de la forma 


ar by2+eya (3) 
con cualesquiera coeficientes racionales a, b, c, es ya un anillo, y esto 
mismo tiene lugar si se considera el caso de coeficientes enteros. 

Examinemos ahora todos los números reales que se pueden obte- 
ner aplicando varias veces las operaciones de adición, multiplicación 
y sustracción al número xt, bien conocido por el lector, y a números 
racionales cualesquiera. Estos son los números que se pueden escribir 
en la forma 


aan at. aa, (4) 


donde ap, 44, as, . + ., ap Son números racionales, n >0. Obsérvese 
que ningún número puede poseer dos expresiones distintas de la 
forma (4), puesto que, en caso contrario, tomando la diferencia de 
dos expresiones de éstas obtendríamos que el número 7 tendría que 
satisfacer a una ecuación de coeficientes racionales; sin embargo, 
con los métodos del análisis matemático se demuestra que n no 
puede satisfacer a ninguna ecuación de coeficientes racionales, o sea, 
es un número trascendente. Por cierto, sin aplicar este resultado, 
o sea, sin suponer que la expresión de un número en la forma (4) sea 
única, se puede demostrar que los números de la forma (4) forman 
un anillo. 

El conjunto de los nú 


obtienen del número x y de los 
números racionales aplicando varias veces las operaciones de sumar, 
multiplicar, restar y dividir, es también anillo. Para la demostración 
no hay necesidad de buscar alguna expresión especial buena para los 
números considerados (a pesar de que podría hallarse): si los números 


meros que 


* En efecto, supongamos que 
Via 072, es 

donde los números a y b son racionales. Multiplicando ambos miembros de esta 
igualdad por f Z, obtenemos: 


20214014 


do aquí la expresión (2) para Y 
llegamos a la igualda 


después de ciertas transformaciones 
simpl 


(toy E 2—ab. (2) 
Si at 06240, resulta, 


—ab 

ab 

lo cual es imposible, pues, el segundo miembro es un número racional. Si 
t2 = 0, en virtud de (27), también 2 — ab — 0. De estas dos igualdades 

resulta que $3 = —2, lo cual de nuevo es imposible, pues el número b es racional. 
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œ y ĝ se han obtenido del número x y de ciertos números racionales, 
empleando las operaciones indicadas, esto mismo es cierto para los 
números a + $, a —$, aß, y también (siendo B 0) para el 
número $ 

Por fin, tomando el conjunto de números complejos a -+ bi 
con cualesquiera coeficientes racionales a, b, se obtiene un anillo; 
esto mismo resulta cuando nos limitamos a coeficientes enteros a, b, 

Los ejemplos examinados no pueden dar una idea completa de 
la diversidad de anillos numéricos existentes. Sin embargo, aquí 
no vamos a continua. ista de ejemplos y pasaremos a estudiar un 
caso especial y muy importante de anillos numéricos. Por supuesto, 
ya sabemos que en los sistemas de todos los números racionales, de 
todos los números reales y de todos los números complejos, se puede 
efectuar la división ¡limitadamente (excepto la división por cero), 
mientras que la división de Jos números enteros sale fera de Jos 
lín.¿tes del sistema de estos números. Hasta ahora no habíamos 
prestado atención a esta distinción pera. en realidad, es muy impor- 
tante y conduce a la definición siguiente. 

Un anillo numérico se Hama campo numérico, si éste contiene el 
cociente de dos cualesquiera de sus números (se supone que el divisor 
es diferente de cero). Por consiguiente, se puede hablar del campo 
de números racionales, del campo de núme: s, del campo de 
números complejos, por otra parte, el anillo de los números enteros 
no forma un campo. 

El realidad, algunos de los ejemplos considerados anteriormente 
de anillos numéricos son campos. Ante Lodo, obsérvese que no existen 
campos numéricos distintos del campo de números racionales y con- 
tenidos totalmente en éste (no se considera campo el sistema formado 
por el cero único). Se cumple incluso la siguiente afirmación más 
general: 

El campo de números racionales está contenido totalmente en cual- 
quier campo numérico. 

En efecto, sea dado un campo numérico, que designaremos con la 
letra P, Si a es un número arbitrario del campo P y diferente de 
cero, P contiene también el cociente de la división del número a 
por sí mismo, o sea, el número uno. Sumando unas cuantas veces la 
unidad consigo misma, obtenemos que todos los números naturales 
están contenidos en el campo P. Por otra parte, en el campo P tiene 
que estar contenida la encia a — a, o sea, el número cero, y, 
por esto, también pertenece a P el resultado que se obtiene al restar 
de cero cualquier número natural, es decir, cualquier número entero 
negativo. Finalmente, en el campo P están contenidos también los 
cocientes de los números enteros, o sea, en general, todos los números 
racionales. 
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En el campo de los números complejos están contenidos muchos 
campos distintos, siendo el campo de números racionales el menor 
de ellos. Así, pues, el anillo de los números de la forma 


aby2 (5) 
con coeficientes racionales (y no sólo con enteros) arbitrarios a, b, 
es un campo. En efecto, consideremos el cociente de dos números de 
la forma (5), a -- 6/2 y c -d VŽ, donde se supone que este último 
es diferente de cero; por consiguiente, también es diferente de cero 
el número e — d VZ de donde, 
aby? _ (aro V2 (e—a V2) _ac—2%d dead 
ela V2 {ena Vð (e—a V) ATA ¿28 
lemos obtenido de nuevo un número de la forma 
racionales los coeficientes. Naturalmente, en este ejemplo se puede 
sustituir el número VŽ por z cuadrada de cualquier número 
cional, cuya raíz cuadrada no pudiese ser extraída en el mismo 


campo de números racionales. Así, pues, los números de la forma 
a - bi con coeficientes racionales a, b forman un campo. 


manteniéndose 
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En distintas ramas de las mate 

snele ocurrir frecuentemente que las operaciones algebraicas no se 
efectúan con números, sino con objetos de naturaleza distinta. En los 
apítulos anteriores se pueden hallar muchos de estos ejemplos 
recordemos el producto y la suma de matrices, la suma de vectores, 
las operaciones con los polinomios, las operaciones con las trans. 
formaciones lineales. La definición general de operación algebraica 
a que satisfacen las operaciones de sumar y de multiplicar en los 
anillos numéricos, y tambi las operaciones en los ejemplos indi- 
cados, consiste en lo siguiente, 
Sea dado un conjunto M que conste de números o de objetos de 
uraleza geométrica, o en general, de algunos entes, que llamare- 
mos elementos de este conjunto, Se dice que en el conjunto M está 
definida una operación algebraica, si está indicada una regla según 
la cual, a cada par de elementos a, b de este conjunto se pone en co- 
rrespondencia de un modo unívoco un tercer elemento c, pertenecien- 
le también a M. Esta operación puede llamarse adición (o suma), 
y entonces, e se Mamará suma de los elementos a y b, representándoso 
con la notación e a -+ b; esta operación puede Humarse multipli- 
cación, o sea, e será el producto de los elementos a y b (c = ab): 
finalmente, es posible que para la operación definida en el conjunto 
M se introduzca una nueva terminología y simbolismo. 


ticas y en sus aplicaciones, 


18% 
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En cada uno de Jos anillos numéricos están definidas dos opera- 
ciones independientes, la adición y la multiplicación. En lo que 
se refiere a la resta y a la división, éstas no pueden considerarse ope- 
raciones nuevas, pues son las inversas de la adición y multiplicación 
respectivamente, si convenimos en tomar la siguiente definición 
general de operación inversa. 

Supongamos que en el conjunto M está definida una operación 
algebraica, por ejemplo, la suma. Se dice que para esta operación 
existe una operación inversa, la resta, si para cada par de elementos 
a, b de M, existe en M un elemento d, unívocamente determinado, 
que satisface a la igualdad: b +- d = a. En este caso, el elemento d 
se lama diferencia de los elementos a y b y se designa con la nota- 
ción d > a — b. 

Está claro que tanto la suma como la multiplicación poscen 
operación inversa en los campos n cos (por cierto, la multipli 
cación con cierla resiricción: el divisor tiene que ser diferente de 
cero). En los anillos numéricos que no son campos (como, por ejem- 
plo, en el anillo de los números enteros), solamente la suma posee 
operación inversa. 

Por otra parte, en el sistema de todos Jos polinomios en la inde- 
terminada z, cuyos coeficientes pertenecen a un campo numérico 
fijado P, también están definidas dos operaciones: la suma y el 
producto; además, la suma posee operación inversa: la r 

Como se sabe, tanto en los anillos numéricos como en el sistema 
de los polinomios, las operaciones de sumar y multiplicar poseen 
Jas propiedades siguientes (a, b, c, son números arbitrarios del anillo 
numórico considerado o polinomios arbitrarios del sistema conside- 
rado): 

I. La adición es conmutativa: a 
KI. La adición es asociativa: a + (b 
11. La multiplicación es conmntativa: ab 
IV. La multiplicación es asociativa: a (bc) = (ab) e. 
V. La adición y la multiplicación están ligadas por la ley 
distributiva: 


(a+ b)c=ac= be. 


Ahora ya estamos preparados para hacer la definición general 
del concepto de anillo, que es uno de los conceptos fundamentales 
del álgebra. 

Un conjunto R se denomina anillo, si se han definido en él dos 
operaciones, llamadas adición o suma y multiplicación, siendo ambas 
conmutativas y asociativas, y ligadas por la ley distributiva, poseyen- 
do además la suma la operación inversa, llamada resta. 

Por lo tanto, son ejemplos de anillos, los anillos numéricos y los 
anillos de polinomios en la indeterminada z con coeficientes de un 
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campo numérico dado e incluso de un anillo numérico dado. Seña- 
lemos otro ejemplo más que aclara con amplitud el concepto de 
anillo, 

El curso de análisis matemático comienza con la definición de 
función de la variable real z. Consideremos el conjunto de las fun- 
ciones, determinadas para todos los valores reales de z y que toman 
valores reales. En él definiremos las operaciones algebraicas del modo 
siguiente: la suma de dos funciones f (x) y g (x) será una función cuyo 
valor para cualquier z = zọ será igual a la suma de los valores de las 
funciones dadas, o sea, igual a f (zo) + g (zo); el producto de estas 
funciones será una función cuyo valor para cualquier z = tọ será 
igual al producto f (20)-g (zo). Es evidente que la suma y el producto 
existen para cualesquiera dos funciones del conjunto considerado. 
La validez de las propiedades I-V se comprueba sin dificultad 
alguna: la suma y multiplicación de funciones se reducen a la suma 
y multiplicación de sus valores para cualquier z, es decir, a opera- 
ciones con números reales para los que se cumplen las propieda- 
des I-V. Finalmente, tomando por diferencia de las funciones 
į (£) y g (2) la función cuyo valor para cualquier £ = zp sea igual 
a la diferencia f (+0) — g (ro), obtenemos la sustracción, operación 
inversa a la adición. Con esto queda demostrado que el conjunto de 
las funciones determinadas para todas las x reales, después de haber 
introducido del modo descrito anteriormente las operaciones de sumar 
y multiplicar, se convierte en un anillo, 

Se pueden obtener otros ejemplos de anillos de funciones, conser- 
vando las definiciones de las operaciones con las funciones dadas 
ħnteriomente, pero, considerando, por ejemplo, las funciones deter- 
minadas sólo para los valores positivos de la variable æ o las funcio- 
nes determinadas para los valores z del segmento [0, 11. En general, 
stema de todas las funciones que tienen un campo dado de defi- 
nición, es un anillo. También se podrían obtener ejemplos de anillos 
sin considerar todas las funciones determinadas en un campo dado, 
sino solamento las funciones continuas que se estudian en el curso de 
análisis matemático. Por otro lado, se podrían considerar las fun- 
ciones complejas de variable compleja. Existen muchísimos anillos 
distintos de funciones, así como distintos anillos numéricos. 
tablezcamos algunas propiedades elementales de los anillos 
que se deducen inmediatamente de su definición. 

Estas propiedades son ordinarias para el caso de los números, 
sin embargo, pueda ser que al lector le sorprenda que éstas sean 
consecuencia solamente de las condiciones l-V y de la existencia 
unívoca de la resta, 

Hagamos primero unas cuantas observaciones sobre la importan- 
cia de las condiciones 1—V. El papel de las leyes conmutativas 
no necesita explicaciones. El valor de las leyes asociativas consiste 
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en lo siguiente: en la definición de la operación algebraica se t 
de la suma o del producto de dos elementos solamente, Si, por ejem- 
plo, probamos definir el producto de tres elementos a, b, c, nos 
encontramos con la dificultad de que, por lo general, los productos 
au y vc, donde be — u, ab = v, pueden no coincidir, o sea, a (bc) Y 
+ (ab) c. La ley asociativa exige que éstos productos sean iguales 
a un mismo elemento del anillo: lta natural tomar este elemento 
por producto abe, escribiéndolo ya sin paréntesis. La ley asociativa 
permite también definir univocamente el producto (respectivamente, 
la suma) de cualquier número finito de elementos del anillo, es decir, 
permite demostrar la independencia del producto de cualesquier 

elementos de la distribución primaria de los paréntesis. 


Demostremos esta afirmación por el método de inducción sobre n. 
se ha demostrado ya para n = 3, por lo cual suponemos que n 3 y que nues- 
tra afirmación ya está demostrada para todos los números menores que n. $ 
dados los elementos ap, as, .-» an Y Supongamos que en esto sistema se han dis 
tribuido los paréntesis de algún modo, indicando el orden en que se debe elec 
tuar la multiplicación. La última operación consistirá en multiplicar el producto 
«le los primeros k elementos ay de 1 < k <n — 1) por el produ 
anti akys +»: an. Como estos productos constan de un número de factores menor 

ue m, y que por la hipótosis están definidos univocamente, no queda más que 
lemostrar Ja igualdad 


TOS 


para cualesquiora k y L 
Con esto fin, es suficiente considerar el caso 111 no este caso, 
poniendo 


ayas coo ah =b, anys Ansa ei Mn =e 


ativa, obten 


y. basándonos on la ley 
b (aps16) = (bax 1) ©- 


Con esto queda demostrada nuestra afirmación. 


En particular, se puede hablar del producto de n elementos 
iguales entre sí, o sea, se puede introducir el concepto de potencia a" 
del elemento a con exponente entero y positivo n. Se comprueba fácil- 
mente que son válidos en cualquier anillo las reglas de operación 
con los exponentes. De modo análogo, la ley asociativa de la adición 
nos lleva al concepto de múltiplo na del elemento a con un coeti- 
ciente entero y positivo r. 

La ley distributiva, es decir, la regla ordinaria para abrir parén- 
tesis, es la única exigencia en la definición de anillo que liga la 
suma y la multiplicación; el hecho de que el estudio simultáneo 
de las dos operaciones indicadas proporcione algo más que lo que 
se podría obtener al estudiarlas por separado, se debe solamente 
a esta ley. En la formulación de la ley distributiva participa única- 
mente la suma de dos términos. Pera sin dificultad se demuestr: 
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que so verifica la igualdad 
(as, 
para cualquier k, y la regla general para multiplicar una suma por 
otra, 
En cualquier anillo también se cumple la ley distributiva para la 
resta. En efecto, según la definición de la resta, el elemento a —b 
satisface a la igualdad 


+ ax) b=ayb4 azb+... + arb 


bi (a—b)=a. 
Multiplicando por e ambos miembros de 
al primer miembro de ésta la ley distribu 
be+(a—0)c=ac. 
Por consiguiente, el elemento (a—b)e es la diferencia de los ele- 
mentos ue y be: 


ta igualdad y aplicando 
a, obtenemos: 


(a —b)0 =ac—be. 


De la existencia de la resta se deducen unas propiedades muy 
importantes de los anillos. Si a es un elemento arbitrario del anillo R, 
la diferencia a—a es un elemento del anillo completamente deter- 
minado, Su papel es análogo al del cero en los anillos numéricos, 
mas, según la definición, éste puede depender de la elección del 
elemento a y, por esto, lo designaremos por ahora mediante O. 

Demostremos que para todos los a; los elementos 0, son iguales 
entre sí. En efecto, si b es otro elemento arbitrario del anillo R, 
agregando el elemento 0, a ambos miembros de la igualdad 


a+ (b—a)=b 
y aplicando la igualdad O, a- a, resulta: 
0,+b=0 +a=(b—a)- as (ba) b. 
Por lo tanto, 


Va: bbM. 

Hemos demostrado que todo anillo R posee un elemento univoca- 
mente determinado, cuya suma con cualquier elemento a de este anillo 
es igual a a. Este elemento se llamará cero del anillo R y se desig- 
nará con el símbolo 0, no representando un peligro serio el que sea 
confundido con el número cero. Por lo tanto, 


a-+0=a para todos los elementos a de 7 


En cualquier anillo, para cada elemento a existe un elemento 
opuesto —a univocamente determinado que satisface a la igualdad: 


a (0) =0; 
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precisamente, este elemento es la diferencia 0—a; la unicidad 
es consecuencia de la unicidad de la resta. Evidentemente 
a) =a. La diferencia b—a de dos elementos cualesquiera 
del anillo se puede escribir ahora de la forma 
b—a=b+(—a). 
En efecto, 
+ (a) +a=b+- (a) +4] =b} 0=b. 
Para cualquier elemento a de un anillo y cualquier número entero 
positivo n, se cumple la igualdad: 
n(—a)= — (na). 
En efecto, agrupando los términos resulta: 
na n(—a)=nla+(—a)] =n 


=0. 


Hemos obtenido ahora la posi 
negativos de un elemento del anillo: siendo n > 0, los elementos 
iguales n (—a) y — (na) se designarán mediante (—n) a. Finalmente, 
convengamos tomar por cero del anillo considerado el múltiplo nulo 
0-a de cualquier elemento. 

Hemos dado la definición del cero empleando solamente la suma 
y su operación inversa, o sea, sin utilizar la multiplicación. Sin 
embargo, en el caso de los números, el cero posee respecto a la mul 
tiplicación una propiedad característica, que es además muy imp 
tante. El cero de cualquier anillo posee la propiedad: en cualquier 
anillo, el producto de cualquier elemento por el cero es igual a cero. 
La demostración se basa directamente en la ley distributiva: siendo a 
un elemento arbitrario del anillo R, cualquiera que sea el elemento 
auxiliar x de este anillo, se tiene: 


a:0=a(2—2)=ax—ar=0. 


dad de definir los múltiplos 


Aplicando esta propiedad del cero se puede demostrar que er 
cada anillo, para cualesquiera elementos a, b, se cumple la igualdad: 
(—a)b= —ab. 

En efecto, 
b + (—a) b= |a + (—a)) b= 0-b =0. 


De aquí se deduce que la conocida regla de la multiplicación de los 
números negativos, «menos por menos da más», también se deduce 
de la definición de anillo, es decir, que en cualquier anillo se verifica 
la igualdad 


(—a)(—b)=ab. 
En efecto, 
(0 (—0)= — la (—b)] = —(— ab) = ab, 
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El lector demostrará ahora sin dificultad que en cualquier anillo, 
para los múltiplos (incluyendo los negativos) de cualquier elemento 
son válidas todas las reglas de operaciones con los múltiplos de un 
número. 

Por lo tanto, las operaciones algebraicas en cualquier anillo 
poseen muchas propiedades ordinarias de las operaciones con los 
números. Sin embargo, no hay que creer que en cualquier anillo 
se conservan todas propiedades de la suma y multiplicación 
de los números. Así, pues, la multiplicación de los números posee 
una propiedad que es recíproca a la considerada anteriormente 
si el producto de dos números es igual a cero, al menos uno de los 
factores es igual a cero. Esta propiedad ya no se puede generalizar 
para cualquier anillo, pues, en algunos anillos se pueden señalar 
pares de elementos diferentes de cero, cuyo producto es igual a cero, 
es decir, a+ 0, b%0, pero ab = 0; los elementos a, b, que poseen 
esta propiedad se llaman divisores de cero. 

Claro, entre los anillos numéricos no se pueden hallar ejemplos 
de anillos con divisores de cero. Tampoco contienen divisores de 
cero los anillos de polinomios de coeficientes numéricos. Pero hay 
muchos anillos de funciones que poseen divisores de cero. Obsérvese 
primeramente que en cualquie llo de funciones el cero es la 
función que se convierte en cero para todos los valores de la varia- 
ble z. Consideremos ahora las funciones f (z) y g (z) que siguen, del 
nidas para todos los valores reales de x: 


Í(2)=0 para 2<0, f(z)=x para 2>0; 
gle) 0, g()=0 para 20, 


stas funciones son diferentes de cero, pues, sus valores no son 
iguales a cero para todos los valores de z; sin embargo, el producto 
do estas funciones es igual a cero. 


æ para z 


No todas las condi 


mes 1-V que figuran en la definición do anillo son nec 
o! 


sarias en igual medida. El desarrollo de la ciencia muestra que mientras las pro- 
piedades I y TI do la suma y la ley distributiva V se cumplen en todas las apli- 
caciones, la introducción de las propiedades II y IV de la multiplicación en 


la definición de anillo resulta demasiado incómoda, reduciendo el posible cam- 
po de aplicación do este concepto. Así, pues, el conjunto de las matrices cua- 
dradas de orden n de elementos rea siderado con las operaciones de adi 
ción y multiplicación de matrices, sa ones que figuran 
en la definición de anillo, excluyendo la ley conmutativa de la multiplicación. 
Las multiplicaciones no conmutativas aparecen con tanta frecuencia y en casos 
tan importantes que actualmente el término de «anillo» se entiende ordinaria- 
mente como anillo no conmutativo (mejor dicho, como un anillo que no es 
necesariamente conmutativo, en el sentido de que la multiplicación puede ser 
no commutativa), Mamando ' anillo conmutativo al tipo particular de anillos 
en los que se cumple la condición I 
Ultimamente ha aumentado el interés hacia los anillos con multiplicación 
no asociativa, elaborándose ya la teoría general de los anillos como la teoría 
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de los anillos no asociativos (es decir, que no son necesariamente asociativos). 
El conjunto de vectores del espacio euclideo de tres dimensiones respecto a las 
operaciones de la suma y de la multiplicación vectorial (conocida por el curso 
de geometría analítica) es un ejemplo simple de tales anillo: 


$ 45. Campo 


Del mismo modo que entre los anillos numéricos fueron elegidos 
y denominados campos numéricos aquellos anillos en los que se 
podía efectuar la división (excepto la división por cero), resulta natu- 
ral hacer lo mismo en el caso general. Obsérvese primeramente que 
en ningún anillo es posible la división por cero, debido a la propiedad 
del cero respecto a la multiplicación, demostrada anteriormente: 
dividir un elemento a por cero significa hallar en el anillo un ele- 
mento z tal, que 0-2 = a, lo cual es imposible si a 0, pues, el 
primer miembro es igual a cero. 

Hagamos la definición siguiente: 

Un anillo P se llama campo, si consta no sólo del cero y en él 
es posible la división en todos los casos (a excepción de la división 
por cero), determinándose ésta unívocamente, o sea, si para cuales- 
quiera elementos a, b de P, de los cuales Ù es diferente de cero. 
existe en P un elemento g, y sólo uno, que satisface a la igualdad: 
bg = a. El elemento q se llama cociente de los elementos a y b y se 


designa con la notación q=*. 


Naturalmente, todos los campos numéricos son ejemplos de 
campos. El anillo de los polinomios en la indeterminada z con coefi- 
cientes reales o, en general, con coeficientes de algún campo numéri- 
co, no es campo: la división con resto que existe para los polinomios 
se diferencia, naturalmente, de la división «exacta», supuesta en la 
definición de campo. Por otra parte, se ve fácilmente que el conjunto 


* En realidad, la unicidad do la división en un campo, así como la unicidad 
de la resta, supuesta en la definición de anillo, so puede demostrar sin dificul 
tad aplicando otras condiciones que figuran en la definición de campo o, tes 
pectivamente, de anillo (Vota del A.). 

Un caso más general resulta cuando no so insiste en que la operación de 
multiplicar satisfaga a la ley conmutativa (o sea, cuando el anillo puede ser 
no conmutativo; véase la última parte del $ 44). En este caso, además del ele- 
mento q, tiene que existir en P un elemento q” (que puede ser distinto de g), 
y sólo uno, que satistaga a la igualdad: q'b = a. El anillo P se llama entonces 
«cuerpo. Por lo tanto, se puede decir que campo es un cuerpo conmutativo. 

Según parece, el vocablo «campo», para la denominación abreviada de un 
guerpo commutativo, ha sido empleado por primera vez on castellano por 
R. Rodríguez Vidal, en su traducción de la obra de Birkhoff y Mac Lane «Algebra 
Moderna». Teniendo también en cuenta que en los libros soviéticos, el vocablo 
«noxo» («campo») está ya admitido hace muchos años, creemos conveniente em- 
plear a continuación este último como traducción del primero. (Vota del 7.). 
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de las funciones racionales con coeficientes reales.(véase el $ 25) forma 
un campo que contiene al anillo de los polinomios, del mismo modo 
que el campo de los números racionales contiene al anillo de los núme- 
ros enteros. 

Entre los anillos de funciones se pueden indicar otros ejemplos 
de campos; sin embargo, aquí no vamos a detenernos en ellos 
y pasaremos a examinar otros ejemplos de distinto género. 

Todos los anillos numéricos y, en general, los anillos que hasta 
ahora hemos examinado, contienen una infinidad de elementos. 
Sin embargo, existen anillos e incluso campos que constan de un 
número finito de elementos. Los ejemplos más simples de anillos 
finitos y campos finitos, empleados esencialmente en la teoría de los 
números, se forman del modo siguiente. 

Se toma un número natural cualquiera n, diferente de 4. Los 
números enteros a y b se llaman congruentes respecto del módulo n, 


a =b(módn), 


si al dividirlos por n dan un mismo residuo, o sea, si su diferencia 
es divisible por n. Todo el anillo de los números enteros se descompo- 
ne en » clases disjuntas, 


Dilig 


nto (1) 


de números congruentes entre sí respecto del módulo n, donde la 
clase Ch, k = 0, 4, .. -. n — 1, consta de los números que al divi- 
dirlos por n dan el residuo k. Resulta que se puede definir la suma 
y el producto de estas clases de un modo muy natural. 

Con este fin, tomemos unas clases cualesquiera C}, y C; (no nece 
riamente distintas) del sistema (1). Sumando cualquier número de la 
clase C, con cualquier número de la clase C,, obtenemos cada vez 
números que pertenecen a una clase determinada: a la clase Cp, 
sik -1< n, o a la elase Copos Si k + L> n. Esto nos Heva a la 
siguiente definición de suma de las clases: 


CiCi=Ca si k-1<n, 


si ki lon 
Por otra parte, multiplicando cualquier número de la elase Cy por 
cualquier número de la elase C,, obtenemos números que están de 
nuevo en una clase determinada: precisamente en la clase C,, donde 
r es el residuo de la di del producto kl por n. Por lo tanto, 
tomamos la definición siguiente de producto de clases: 


Cr-Ci=Cn, donde kl -ng r, O~ ran. (3) 


El sistema (1) de clases de números enteros, congruentes entre si 
respecto del módulo n, es un anillo respecto de las operaciones definidas 
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por las condiciones (2) y (3). En efecto, la validez de las condiciones 
l-V de la definición de anillo se establece comprobándolas directa- 
mente, Además, es también consecuencia de la validez de estas 
condiciones en el anillo de los números enteros y de la relación 
indicada anteriormente entre las operaciones con los números enteros 
y las operaciones con las clases. Está claro que la clase Co, compuesta 
de los números divisibles por n, desempeña el papel del cero. El ele- 
mento opuesto para la clase Cp, k = 1, 2, ..., n — 1, es la clase 
Cn.» Por consiguiente, en el sistema de las clases (1) se puede defi- 
nir la resta, es decir, este sistema satisface a todas las condiciones 
que figuran en la definición de anillo. Convengamos en designar el 
anillo obtenido mediante Zn. 

Si el número n es compuesto, el anillo Z, posee divisores de cero 
y, por esto, como se demostrará más abajo, no puede ser campo. 
En efecto, si n = kl, donde 1<k<n, 1<1< n, las clases Cy 
y C; son distintas de la clase cero Co, pero, según la definición del 
producto de las clases (véase (3), Cy Cr == Co- 
Si el número n es primo, el anillo Z, es un campo. 
En efecto, sean dadas la: Ch Y Cm, donde C, + Co, 0 sca, 
ck<n— A. Hay que demostrar que se puede dividir Cm por 
, © sea, que se puede hallar una clase C; tal, que Ca- Cz = Cm- 
Co, se tiene C; = Co. Si Cm = Co consideramos el sistema 
de números 


k, 2k, 3k, .-., (1—1) k. (4) 


Todos estos números están fuera de la clase cero Co, pues, el producto 
de dos números naturales menores que el número primo n no puedo 
ser divisible por éste. Por otra parte, ninguno de los dos números 
sk y tk del sistema (4), s < t, puede estar situado en una clase, puesto 
que, en caso contrario, su diferencia 


tk = (ts) k 


sería divisible por n, lo cual es absurdo, debido a que el número n es 
primo. Por lo tanto, en cada clase no nula está situado exactamente 
un número del sistema (4). En particular, en la clase Cm está situado 
el número lk, donde 1<1<n — 1, o sea, Cr: Cr = Cm, y entonces 
la clase C, es el cociente buscado de la división de Cm por Ch. 

Por consiguiente, hemos obtenido una infinidad de campos fini- 
tos distintos: el campo Zz, compuesto de dos elementos solamente, 
y también los campos Zs, Zs, Z;, Zi ete. 

Ahora veremos algunas propiedades de los campos que se deducen 
de la existencia de la división. Estas propiedades son análogas 
a las propiedades de los anillos basados en la existencia de la resta 
y se demuestran con los mismos razonamientos, por lo cual, la demos- 
tración la dejamos al lector. 
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Todo campo P posee un elemento, univocamente determinado, cuyo 
producto por cualquier elemento a de este campo es igual a a. Este ele- 


mento, que coincide con los cocientes iguales entre sí E para todos 


los a, diferentes de cero, se llama unidad del campo P y se designa 
con el símbolo 1. Por lo tanto, 


a:1=a para todos los elementos a de P. 
En todo campo, para cualquier elemento a diferente de cero, existe 


un elemento recíproco a, univocamente determinado, que satisface 
a la igualdad 


aa 


este elemento es precisamente a” 


Está claro que (a)? =a. 


$ i b A 
EL cociente -y se puede escribir ahora en la forma 


Loba. 


Para cualquier elemento a diferente de cero, y cualquier ente- 
ro positivo n, se verifica la igualdad 


(at) = (any, 


Designando estos elementos iguales entre sí mediante a`”, obtenemos 


las potencias negativas de un elemento del campo, para las que rigen 


las reglas de operación ordina 
para todos los a. 

La existencia de unidad no es una propiedad característica de los 
campos, pues, por ejemplo, el anillo de los números enteros posee 
unidad. Sin embargo, el ejemplo del anillo de los números pares 
muestra que no todos los anillos poseen unidad. Por otra parte, 
todo anillo que posea unidad y que contenga al elemento reciproco de 
cualquier elemento diferente de cero, es un campo. En efecto, en este 


mos, finalmente, «% 1 


E A b nga 
caso el producto ba™, a+ Ù, servirá de cociente -. La unicidad 


de este cociente se demuestra sin dificultad alguna. 

Obsérvese que ningún campo contiene divisores de cero. En efecto, 

sea ab — 0, pero a 0. Multiplicando ambos miembros de la igual- 
dad por el elemento a”, en el primer miembro resulta (a™ a) b = 
= 1-b = b, y en el segundo, a2-0 — 0, o sea, b = 0. De aquí se 
deduce que en todo campo cualquier igualdad se puede simplificar 
por un factor común diferente de cero. En electo, si ac == bc y c+ 0, 
se tiene (a — b) c = 0, de donde a —b=0, o sea, a = b. 
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De la definición del cociente $ (donde b 0) y de la posibilidad, 
anteriormente demostrada, de escribirlo en forma de producto «b-t, 
se puede demostrar sin dificultad que en todo campo se conservan las 
reglas ordinarias de operación con los quebrados. A saber, 
£ cuando, y sólo cuando, ad = bc; 


a, e ad=be 


T va * 
a c a, 
v'a ii’ 
Ei a 
v ES 


Característica de un campo. No todas propiedades de los campos 
numéricos se conservan en el caso de un campo arbitrario. Así, pues, 
sumando así mismo el número 1 unas cuantas veces, o sea, tomando 
cualquier entero positivo que sea múltiplo de la unidad, nunca se 
obtendrá el cero. En general, todos estos múltiplos, es decir, todos 
los números naturales, son distintos entre sí. Si se toman enteros múl- 
tiplos de 1 de algún campo finito, entre ellos habrá indispensablemen- 
te algunos que sean iguales, pues este campo tiene sólo un número 
finito de elementos distintos. Si todos los múltiplos enteros de la 
unidad del campo P son elementos distintos de este campo, o sea, 
si k-13 1-1 cuando k+ l, se dice que P es un campo de caracte- 
rística cero; tales son, por ejemplo, todos los campos numéricos. 
Si existen unos números enteros k y l, k > L tales, que en P se 
cumple la igualdad %:1 = 1-1, entonces (k — 1)-4 = 0, es decir, 
existe en P un múltiplo positivo de la unidad igual a cero, llamándo- 
se entonces P campo de característica finita. Precisamente ésta es 
igual a p, si p es el primer coeficiente positivo con el que se anula 
la unidad del campo P. Todos los campos finitos son ejemplos de 
campos de característica finita; existen también campos infinit 
de característica finita. 

Si p es la característica del campo P, el número p es primo. 

En efecto, de la igualdad p — st, donde s < p, £< p, resultaría 
la igualdad (s-1) (£-1) = p-1 = 0, y como el campo no puede tener 
divisores de cero, se tendría s-1 = 0, o bien, t-1 lo cual co: 
tradice a la definición de la característica como el coeficiente posit: 
vo menor que convierte en cero a la unidad del campo. 

Si la característica del campo P es igual a p, para cualquier ele- 
mento a de este campo se verifica la igualdad pa — 0. Si la caracterís- 
tica del campo P es igual a cero, a es un elemento de este campo y n es 
un número entero, entonces las condiciones a 0 y n= 0 implican 
la desigualdad na + 0. 
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En efecto, en el primer caso, el elemento pa, o sea, la suma de 
p términos iguales a a, sacando a fuera de paréntesis, se puede repre- 
sentar en la forma 


pa=a(p-1)=a-0=0. 


lin el segundo caso, para a 0, de la igualdad na = 0, o sea, 
a (n-1) — 0, resultaría la igualdad n-1 = 0, y, como la caracte- 
rística del campo es igual a cero, se tendría n = 0. 

Subcampos, ampliaciones (extensiones). Supongamos que una 
parte de los elementos de un campo P, formando un conjunto P’, 
también forma un campo con respecto a las operaciones definidas 
en el campo P, es decir, que para dos elementos cualesquiera 


a, b de P’, los elementos a -+ b, ab, a — b, y para b + 05 , conte- 


nidos en el campo 2, también pertenecen a P’ (claro, cumpliéndose 
las leyes I-V en P también se cumplen en P’). En este caso, P” se 
llama subcampo del campo P, y P, ampliación (o extensión) del 
campo P’. Es evidente que el cero y la unidad del campo 2 también 
ún contenidos en P’ y en éste sirven también de cero y unidad. 
sí, pues, el campo de los números racionales es un subcampo del 
ampo de los números reales; todos los campos numéricos son sub- 
campos del campo de los números complejos. 

Supongamos que en el campo P se han dado un subcampo P’ 
un elemento e situado fuera de 2”, y que hemos hallado el subeampo 
minimo P” del campo P que contiene a P” y ac. Este subcampo 
minimo tiene que ser único, pues si P” fuese otro subcampo más 
con estas propiedades, la intersección de los subcampos P” y P 
(o sea, el conjunto de los elementos comunes a ambos subcampos) 
contendría a P” y al elemento e y, junto con dos elementos cualesquie- 
ra suyos, contendría también a su suma (esta suma tiene que estar 
contenida en P” y en P” y, por lo en su intersección), 
y también a su producto, resta en otras palabras, esta 
intersección misma sería un subcan lo cual es absurdo, pues el 
subcampo P” es mínimo. Se dice que el campo P” se ha obtenido por 
adjunción del elemento e al campo P’, empleándose la notación 
P Pe 

Evidentemente, el campo 7” (c), además del elemento e y de 
todos Jos elementos del campo /”, contiene también todos los ele- 
mentos que se obtienen de ellos mediante la suma, multiplicación. 
resta y división. Como ejemplo, señalemos la ampliación del campo 
dle los números racionales, con ado en el $ 43, que consta de los 
números de la forma a | 6/2 con racionales a, b; esta ampliación 
se obtiene por adjunción del número 2 al campo de los números 
racionales. 
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$ 46, Isomorlismo de los anillos (de los campos). 
Unicidad del campo de los números complejos 


En la teoría de los anillos desempeña un gran papel el concepto 
de isomorfismo. Los anillos L y Z’ se llaman ¿somorfos si entre sus 
elementos se puede establecer una correspondencia biunívoca tal 
que, para cualesquiera elementos a, b de £ y sus correspondientes 
elementos a”, b de £’, a la suma a + b le corresponda la suma 
a' + b' y al producto ab, el producto a'b’. 

Supongamos que entre los anillos L y Z’ se ha establecido una 
correspondencia de isomorfismo. Entonces al cero O del anillo L le 
corresponde el cero © del anillo L’. En efecto, supongamos que al 
elemento O le corresponde el elemento e” de £/. Tomemos un elemen» 
to arbitrario a de L y el elemento a' de Z’ que le corresponde, 
Entonces, al elemento a -+ O le tiene que corresponder el elemento 
al + c'; pero como a + Ô = a, se tiene, a” + e” =a, de donde 
c' =0', Al elemento —a le corresponde el elemento —a”. En efecto, 
supongamos que al elemento —a le corresponde el elemento d'. 
Entonces al elemento a + (—a) = 0 le tiene que corresponder el 
elemento a' + d', o sea, a + d' = 0, de donde d = —a'. De 


aquí resulta que a la diferencia de elementos de L le corresponde la 
diferencia de los elementos correspondientes de L’. Con razonamientos 


análogos se puede demostrar que, si el anillo Z posee unidad, la ima- 
gen de este elemento (o sea, el elemento que le corresponde en L’, en 
cl isomorfismo considerado) es la unidad del anillo Z’, y si el elemento 
a de L tiene elemento recíproco a~t, la imagen del elemento a”! 
en L’ es el elemento recíproco de a”. 

Do aquí se deduce que un anillo que es isomorfo a un campo, es 
también un campo. Fácilmente se ve tambión que la propiedad de 
un anillo de no tener divisores de cero se conserva también en la 
correspondencia de isomorfismo. En general, los anillos isomorfos 
pueden diferenciarse entre sí por la naturaleza de sus elementos, 
pero, por sus propiedades algebraicas, son idénticos. Cualquier 
teorema demostrado para un anillo subsiste también para los anillos 
que son isomorfos a él, si en la demostración del teorema se emplean 
solamente las propiedades de las operaciones y no las propiedades 
individuales de los elementos de este anillo. Por esta razón, no vamos 
a considerar como diferentes los anillos o los campos que son iso- 
morfos; éstos serán para nosotros distintos ejemplares de un mismo 
anillo o campo. 

Apliquemos este concepto al problema de la construcción del 
campo de los números complejos. La construcción del campo de los 
números complejos expuesta en el $ 17, y basada en la aplicación 
de los puntos del plano, no es la única posible. En lugar de puntos 
se podrían haber tomado segmentos (vectores) en el plano que parten 
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del origen de coordenadas y, dando estos vectores por sus componen- 
tes a, b sobre los ejes coordenados, se determinaría la suma y el 
producto de vectores mediante las mismas fórmulas (2) y (3) del 
$ 17, así como en el caso de los puntos del plano. En general, se 
podría no insistir en aplicar objetos geométricos. Observando que 
los puntos en el plano, así como los vectores en el plano, se deter- 
minan por pares ordenados de números reales (a, b), se puedo tomar 
simplemente el conjunto de tales pares e introducir en él la suma 
y el producto según las fórmulas (2) y (3) del párrafo indicado. 

En realidad, estos campos no se distinguirían por sus propieda- 
des algebraicas, como muestra el teorema siguiente: 

Todas las ampliaciones del campo de números reales D, obtenidas 
por adjunción al campo D de la raíz de la ecuación 


» (1) 
son isomorfas entre si. 

En efecto, sea dado algún campo P que represente una amplia- 
ón del campo D y que contenga al elemento que satisface a la 
ccuación (1). La elección de la notación de este elemento corre 
a nuestro cargo y, para este fin, emplearemos la letra i. Por lo tan- 
to, se cumple la igualdad iè} 14 = 0 (de donde i? — — 1), aquí 
la elevación a potencia y la suma se deben entender en el sentido 
de las operaciones definidas en el campo P. Queremos hallar ahora 
el campo Ø (i) que se obtiene por adjunción del elemento ¿ al campo 
D, es decir, hallar el subcampo mínimo del campo P que contiene 
al campo D y al elemento ¿. 

lxaminemos con este fin todos los elementos æ del campo P que 
se pueden escribir de la forma 


a=a- bi, 2) 


Pii= 


donde a y b son números reales arbitrarios, y el producto del número 
b por el elemento ¿, asi como la suma del número a y este producto, 
> deben entender en el sentido de las operaciones definidas en el 
ampo P. Ningún elemento a del campo P puede poseer dos distintas 
expresiones de esta forma, puesto que de 


pbi=a ; 


a=a 


siendo bb, resultaría 


o sea, i sería un número real; si b — B, resulta a — a. En particu- 
lar, entre los elementos del campo P que se expresan en la forma (2), 
figuran todos los números reales (cuando b = 0), y también el mismo 
elemento ¿ (cuando a 0. b — 1). 


19-252 
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Demostremos que el conjunto de todos los elementos de la forma (2) 
forman un subcampo del campo P; éste será precisamente el campo 
buscado D (i). Sean dados los elementos a = a ~ bi y p = c + di. 
Aplicando las leyes conmutativa y asociativa de la adición, así como 
la Jey distributiva, que rigen en el campo P, obtenemos: 

a- B= (a+ bi) + (e + di) = (a i c) + (bi + di), 
de donde, 


a+p=(a +e) (btd) i, (3) 
o sea, esta suma pertenece de nuevo al conjunto de elementos 
considerado. Por otra parte, 
—PB=(—-0+l-di, 

pues, en virtud de (3), se cumple la igualdad $ + (—8)=0 + 0i =0; 
por lo tanto, 

a—p=a+(—P)=(a—0)+ (bd) i, (9) 
es decir, la resta no salo fuera de los límites del conjunto considera- 
do. Aplicando de nuevo las propiedades l-V a que satisfacen las 
operaciones en el campo P (véase $ 44) y basándose en la igualdad 
it = — 1, obtenemos: 


ap = (a + bi) (e + di) = ac -+ adi -+ bci + bdi?, 


o sea, 


ap = (ac — bd) + (ad + be) i; a) 


por lo tanto, el producto de dos elementos cualesquiera de la forma 
(2) es de nuevo un elemento de esta misma forma. Finalmente, 
supongamos que B 0, es decir, que al menos uno de los números 
e, d, sea diferente de cero. Entonces también c — di + 0 y 


(e+ di)(e—di) = — (di? = c? — dèi? = 4 d°, 
siendo c? -+ d? 0. Por consiguiente, aplicando la afirmación 
hecha en el párrafo anterior, de que en cualquier campo se conservan 
todas Jas reglas de las operaciones con los quebrados y, por ende, un 
quebrado no varía al multiplicar su numerador y denominador por 
un elemento diferente de cero, obtenemos: 
a ajbi _ (atbi)(e—di) _ (ac țbd) i (be—ad) i 


P cdi — ep di) (e—di) c c? d? 
es decir, el elemento 
a ac !-bd 4 belad. 4” 
ae tarai 158) 


tiene de nuevo la forma (2). 
Demostremos ahora que el subcampo obtenido D (i) del campo P 
es isomorfo al campo de puntos del plano construido en el $ 17. Asocian- 
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do al elemento a + bi del campo D (i) el punto (a, b), en virtud 
de la unicidad de la expresión de la forma (2) para los elementos 
del campo D (i), se obtiene una correspondencia biunívoca entre 
los elementos de este campo y todos los puntos del plano. En esta 
correspondencia, al número real æ le corresponde el punto (a, 0), 
debido a la igualdad a = a — Oi, y al elemento i = O + 1.¿, el 
punto (0, 4). Por otra parte, comparando las fórmulas (3) y (4) del 
presente párrafo con las fórmulas (2) y (3) del $ 17, obtenemos que 
a la suma y al producto de los elementos æ y f del campo D (i) les 
corresponden los puntos que son la suma y, respectivamente, el 
producto de los puntos correspondientes de a. y ĝ. 

Como todos los campos que son isomorfos a un campo dado son 
isomorfos entre sí el teorema queda demostrado. Vemos, en parti- 
cular, que la elección de las fórmulas (2) y (3) en el $ 17 para la 
definición de las operaciones con los puntos no fue casual y no puede 
ser modificada. 


Además de los método: , 
jos, examinados anteriormente, existen otros métodos, Señalemos uno 
de estos, aplicando la suma y multiplicación de matrices. 

Examinomos el anillo no conmutativo d 
sobre el campo de los números reales. 


a 0 
(a) 

Jorman en este anillo un subcampo que es isomorfo al campo de los números 

reales. Pero, resulta que en el anillo de las matrices de segundo orden sobre el 

campo de los números reales, se puede hallar también un subcampo que es iso- 


morjo al campo de los números complejos. En efecto, pongamos en corresponden- 
cia a cada número complejo a + bi la matriz 


ab 
(54) 
Do este modo, resulta u ¡cación biunivoca de todo el campo de números 


ap 
complejos en ina parte del anillo de las matrices de segundo orden; además, 
de las igualdades 


¡(AAA A 


ab ed ac—bd adibe 
(i a) N Es o) ás + be) aca) 
se desprende que esta aplicación es isomoría, puesto que las mat 
ran en los segundos miembros de igualdad 
complejos (a + c) + (b 
+ be) i = (a+ bi) (e 4 di 


os comple- 


es de segundo orden 
lente que las matrices escalares 


s que ligu- 
a los números 
(ac — bd) + (ad + 


desempeña el papel de unidad imaginaria. 

El resultado obtenido señala otro posible método de constru 
po de números complejos, que es tan satisfactorio como los co 
riormente. 


ión del cam- 
siderados ante- 


19+ 
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$ 47. Algebra lineal y álgebra de los polinomios 
sobre un campo arbitrario 


En los capítulos precedentes dedicados al álgebra lineal, el 
campo de números reales desempeñaba ordinariamente el papel de 
campo fundamental. No obstante, se comprueba sin dificultad alguna 
que muchos teoremas de estos capítulos se generalizan palabra por 
palabra al caso de un campo fundamental arbitrario, 

Así, pues, para un campo fundamental arbitrario P son válidos 
el método de Gauss de resolución de los sistemas de ecuaciones lineales, 
la teoría de los determinantes y la regla de Cramer, expuestas en el 
cap. 1. Solamente la observación sobre los determinantes antisi- 
métricos, expuesta al final del $ 4, exige la suposición de que la 
característica del campo P sea diferente de dos. Por cierto, la 
demostración de la propiedad 4 de este mismo párrafo carece de valor 
si la característica del campo P es igual a dos, a pesar de que sea 
válida la propiedad misma. 

Es conveniente señalar también que la afirmación, enunciada 
a menudo en el cap. 1, sobre la existencia de un conjunto infinito 
de soluciones distintas de un sistema indeterminado de ecuaciones 
lineales, es válida también en el caso de cualquier campo funda- 
mental P infinito, pero carece de valor si el campo P es finito. 

La teoría de la dependencia lineal de los vectores, la teoría del rango 
de una matriz y la teoría general de los sistemas de ecuaciones lineales, 
expuestas en el cap. 2, ast como el álgebra de las matrices del cap. 3 
se generalizan también totalmente al caso de un campo fundamental 
arbitrario. 

La teoría general de las formas cuadráticas, expuesta en el $ 26, 
se generaliza al caso de cualquier campo fundamental P, cuya caracte- 
rística sea diferente de dos. Sin esta restricción, pierde su valor el 
teorema fundamental de este párrafo. 


Supongamos, por ejemplo, que P = Z2, es decir, que es un campo constituido 
por dos elementos, O y 1, siendo 1 +- 1 = 0, de donde — 1 = 1, y supongamos 
que sobre este campo se ha dado una forma cuadrática f = 212. Si existe una 
transformación lineal 


== byvidyzv 
bavibozya, 
que lleve f a la forma canónica, en [a igualdad 
$= (biyi + Divo) (baty baaa) = Dubai + (bebes +brzbai) yiye + bigbeav? 


tiene que ser igual a cero el coeficiente byybz + Byobz del producto yiya. Sin 
embargo, este coeficiente es igual al determinante de la transformación lineal 
considerada, pues, ya sea byzbet O, en ambos casos, babai = 
= —bzba. Resulta que nuestra transformación lineal es degenerada. 
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El contenido ulterior del cap. 6 se refiere esencialmente a las 
formas cuadráticas de coeficientes complejos o reales. 

Finalmente, para el caso de un campo fundamental arbitrario 
P es válida toda la teoría de los espacios lineales y sus transformaciones 
lineales, expuesta en el cap. 7. Por cierto, el concepto de raíz caracte- 
tística está ligado con la teoría de los polinomios sobre un campo 
arbitrario, de la que se hablará más adelante. Obsérvese que el 
teorema del $ 33, sobre la relación entre las raíces características 
y los valores propios, se enuncia ahora del modo siguiente: las raíces 
características de una transformación lineal q, pertenecientes al 
campo fundamental P, y sólo éstas, son valores propios de esta 
transformación. 

La teoría de los espacios euclídeos (cap. 8) está ligada esencial- 
mente con el campo de los números reales. 

mbién se pueden generalizar para el caso de un campo funda- 
mental arbitrario P algunos de los apartados del álgebra de los 
polinomios expuestos anteriormente. Sin embargo, es necesario 
fijar previamente el sentido exacto del concepto de polinomio sobre 
un campo arbitrario. 

Esto se debe a que en el $ 20 se señalaron dos puntos de vista 
sobre el concepto de polinomio; el concepto formal algebraico y el 
teórico funcional. Ambos se pueden generalizar al caso de un campo 
fundamental arbitrario. No obstante, siendo equivalentes para el 
so de campos numéricos (véase el $ 24) y, como fácilmente se 
comprueba para campos infinitos en general, dejan de ser equivalentes 
ya para campos finilos. 

Veamos, por ejemplo, el campo Zs introducido en el $ 45, com- 
puesto de dos elementos O y 1, siendo 110, Los polinomios 
x+ 1 y a? 1 con coeficientes de este campo, son distintos, o sea, 
no satisfacen a la definición algebraica de igualdad de polinomios. 
Sin embargo, ambos polinomios toman el valor 4 para O yel 
valor 0 para x 4, es decir, como «funciones» de la «variable» z, 
que toma valores en el campo Za, tienen que suponerse iguales. 

En el campo Z, compuesto de elementos: 0, 1, 2, donde 
encuentran en la s polinomios 
LA y 27 54. En general, se pueden indicar ejemplos de 
este tipo para todos los campo 

Por lo tanto, en la teoría 
s imposible adm o de vista teórico funcion 
los polinomios. Por consiguiente, es necesario aclarar def 
amente la definición formal algebraica de polinomio. Con 
ste fin, realizaremos una construcción del 
sobre un cam 
la expresión 
minada» x. 


so de un campo 
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Examinemos todos los sistem tos ordenados posibles de 
elementos del campo P que tienen la forma 


Anas an), (1) 


donde n es arbitrario, n>0; para z >O tiene que ser an 0. 
Determinando para los sistemas de la forma (1), la suma y el pro- 
ducto de acuerdo a las fórmulas (3) y (4) del § 20, convertimos 
el conjunto de estos sistemas en un anillo conmutativo; para 
demostrar que se cumplen las propiedades necesarias no hay más 
que repetir palabra por palabra lo que se hizo en el § 20 para los 
polinomios numéricos. 

En el anillo que hemos construido, los sistemas de la forma (a) 
(caso de n = 0) forman un subcampo que es isomorfo al campo P. 
Esto permite identificar tales sistemas con los elementos correspon- 
dientes a del campo P, o sea, suponer 


(do, as, 


(a)=a para todos los a de P. (2) 
Por otra parte, designemos el sistema (0, 1) con la letra z, 
z=(0, 1). 


Entonces, aplicando la definición de producto indicada anteriormen- 
te, obtenemos que z* = (0, 0, 1) y, en general, 


z* = (0, 0, 0,1) (3) 
D 


Aplicando ahora la definición de suma y producto de sistemas 
ordenados, y también las igualdades (2) y (3), resulta: 


(ao, Gi, As, O] 
(ao) +- (0, a,) 1 (0, 0, a) 
HO 0, ...,0, -an HO 0, ...,0, 4) E 
—— 


n~t veces a veea 
= (ao) + (a) (0, 1) + (a2) (0, 0, 1) 
O, 1)+ (an) (0, 0, 


1 veces n veces 


= aot 0T- at? o nda. 


Por lo tanto, todo sistema ordenado de la forma (1) se puede 
expresar en forma de un polinomio con respecto a z, con coeficientes 
del campo P, siendo evidentemente esta expresión única. Basándose 
finalmente en la conmutatividad ya demostrada de la suma, se puede 
pasar a la expresión según las potencias decrecientes de z. 
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Por consiguiente, construimos aquí un anillo conmutativo que, 
naturalmente, se debe denominar anillo de los polinomios en la inde- 
terminada z sobre el campo P. Este anillo se designa con la notación 
Piel. E 

En el anillo P |x| está contenido el mismo P, lo cual ya se había 
demostrado antes. Así como en el caso de anillos de polinomios sobre 
campos numéricos (véase $ 20), el anillo P |x] posee unidad, no 
contiene divisores de cero y no es campo. 

Si el campo P está contenido en un campo más amplio P, el anillo 
P 12] es un subanillo del anillo P |x}: puesto que todo polinomio con 
coeficientes de P se puede considerar como polinomio sobre el campo 
P, y la suma y el producto de polinomios dependen sólo de sus coefi- 
cientes, no variando al pasar a un campo más amplio. 

Para tener una idea mejor acerca del concepto verdadero del 
«anillo de los polinomios sobre el campo P», examinémoslo tambión 
desde otro ángulo. 

Supongamos que el campo P esi 


contenido como subanillo en 


algún anillo conmutativo Z. Un elemento a del anillo £ se llama 
algebraico sobre el campo P, si existe una ecuación de grado n, n>1, 
con coeficientes del campo P, a la cual satisface el elemento œ; si 
tal ecuación no existe, el elemento æ se lama trascendente sobre + 


el campo P. Está claro que el elemento z del anillo P |x] es trascen- 
dente sobre el campo P. 
Subsiste el teorema siguiente: 
el elemento a del anillo L es trascendente sobre el campo P, el 
subanillo L?, obtenido por adjunción del elemento a al campo P (o sea, 
el subanillo mínimo del anillo Z que contiene al campo P y al ele- 
mento a), es isomorfo al anillo de los polinomios P |x). 
En efecto, cualquier elemento f del anillo Z que se puede expre- 
sar en la forma 


B= a” 4-a"... -anaa n> O, (4) 


con coeficientes do, Ar, .. -, An-1, An del campo P, estará contenido 
en el subanillo Z’. El elemento B no puede poseer dos expresiones 
distintas de la forma (4), pues, restando una expresión de la otra 
ultaría una ecuación sobre el campo P a la que satisfaría el 
elemento æ, lo cual contradice a la hipótesis de que el elemento æ 
es trascendente. Sumando los elementos de la forma (4), según las 
reglas de la adición en el anillo Z, se pueden sumar los coeficientes 
de potencias iguales de æ; sin embargo, ésto coincide con la regla 
de adición de los polinomios. Por otra parte, multiplicando los ele- 
mentos de la forma (4) según las leyes de la multiplicación en el anillo 
L y aplicando la ley de distribución, podemos efectuar la multi- 
plicación término a término y reunir después los términos semejan- 
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tes; evidentemente, esto nos lleva a la conocida regla de la multi- 
plicación de los polinomios. Con esto queda demostrado que los 
elementos de la forma (4) forman en el anillo Z un subanillo que 
contiene al campo P y al elemento a, es decir, que coincide con Z’, 
y que este subanillo es isomorío al anillo de los polinomios P |]. 

Vemos, pues, que la elección que hicimos de las definiciones para 
las operaciones con los polinomios no fue casual: ésta queda comple- 
tamente determinada debido a que el elemento x del anillo P Jz) 
tiene que ser trascendente sobre el campo P. 

Obsér que al construir el anillo de los polinomios P |] 
nunca se aplicó la división de los elementos del campo P y solamente 
una vez, cuando se demostraba la proposición sobre el grado del pro- 
ducto de los polinomios, hubo que referirse a la ausencia de divisor 
de cero en el campo P. Por consiguiente, se puede tomar un anillo 
conmutativo arbitrario L, y repitiendo la construcción realizada 
anteriormente, resulta el anillo de los polinomios L |æ) sobre el anillo L; 
si en este caso el anillo L no contiene divisores de cero, el grado 
del producto de los polinomios será igual a la suma de los grados 
de los factores y, por consiguiente, el anillo de los polinomios Z [z] 
tampoco contendrá divisores de cero. 

Volviendo a considerar los polinomios con coeficientes de un 
campo arbitrario P, observemos que, substancialmente, toda la 
teoría de la divisibilidad de los polinomios (véanse $$ 20-22) se gene- 
raliza a este caso. Precisamente, er el anillo P le] tiene valor el 
algoritmo de la división con resto, en la que el cociente, así como el 
residuo, pertenecen también al anillo P [x]. También tiene sentido 
en el anillo P [z| el concepto de divisor y se conservan todas sus propieda- 
des principales. Además, como el algoritmo de la división no nos saca 
fuera de los límites del campo fundamental P, se puede afirmar que 
la propiedad del polinomio q (x) de ser divisor de f (2) no depende de 
que se considere el campo P o cualquier ampliación de él. 

En el anillo P (x| se conservan también la definición y todas las 
propiedades del máximo común divisor, incluyendo el algoritmo de 
Euclides y el teorema demostrado en el $ 21 mediante este algoritmo. 
Obsérvese que, como el algoritmo de la división con resto no 
depende, como ya sabemos, del campo fundamental elegido, se 
puede afirmar que el máximo común divisor de dos polinomios dados 
tampoco depende de que se considere el campo P o una ampliación arbi- 
traria P del mismo. Finalmente, para los polinomios sobre el campo P 
tiene sentido el concepto de raíz y conservan su valor las propiedades 
fundamentales de las raíces. 

También se conserva la teoría de las raíces múltiples; por cierto, 
al final del párrafo siguiente volveremos a examinar esta cuestión. 

Estas observaciones nos permitirán referirnos en adelante a los 
$5 20-22 al estudiar los polinomios sobre cualquier campo P. 
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$ 48. Descomposición de los polinomios 
en factores irreducibles 


En virtud del teorema de existencia de raíz ($ 24), para los cam- 
pos de números complejos y reales quedó demostrada la existencia 
y unicidad de la descomposición de un polinomio en factores irre- 
ducibles. Estos resultados son casos particulares de los teoremas 
generales referentes a polinomios sobre un campo arbitrario P. 
El presente párrafo está dedicado a la exposición de esta teoría gene- 
ral, que es análoga a la teoría de la descomposición de los números 
enteros en factores primos. 

Determinemos primera los polinomios que desempeñan en el 
anillo de los polinomios el mismo papel que los números primos en 
el anillo de los números enteros. Subrayemos previamente que en 
esta definición se va a tratar solamente de polinomios de grado 
mayor o igual a la unidad: esto corresponde al hecho de que en la 
definición de los números primos, al estudiar las descomposiciones 
de los números enteros en factores primos, los números Í y —1 sı 
excluyan. 

Sea dado un polinomio f (z) de grado n, n>1, con coeficientes 
pertenecientes al campo P. En virtud de la propiedad V del $ 21, 
todos los polinomios de grado cero son divisores de f (+). Por otra 
parte, en virtud de VII, también son divisores de f (x) todos los 
polinomios cf (x), donde c es un elemento de P diferente de cero, 
agotándose con éstos todos los divisores de f (x) de grado n. En cuanto 
a los divisores de f (x), de grado mayor que 0, pero menor que 7, 
éstos pueden existir en el anillo P |z], o pueden no existir. En el 
primer caso, el polinomio f (x) se llama reducible en el campo P 
(o sobre el campo P); en el segundo caso, irreducible en este campo 
(o sobre este campo). 

Recordando la definición de divisor se puedo decir que un poli- 
nomio f (x) de grado n es reducible en el campo P, si se puede descompo- 
ner sobre este campo (o sea, en el anillo P |x|) en el producto de dos 
factores de grados menores que n: 


f(x) = ẹ (x) 4 (2); (mm 

f (£) es irreducible en el campo P, si en cualquiera de sus descompos 
ciones de la forma (1), uno de los factores es de grado Ù y otro, de grado n. 
Es menester tener en ex puede hablar de reducibilidad 

o irreducibilidad de un polinomio a un campo 
dado P, pues, un polinomio que es ble en este campo puede 
ser reducible en cierta ampliación P de él. Por ejemplo, el polino- 
mio 7? — 2 de coeficientes enteros es irreducible en el campo de 
números racionales, puesto que no se puede descomponer en un 
producto de dos factores de primer grado con coeficientes racionales. 


298 Cap. X Campos y polinomios 


Sin embargo, este polinomio es reducible en el campo de números 
reales, como muestra la igualdad 

2-2 (VD r+ VD). 
polinomio a? + 1 no sólo es irreducible en el campo de números 
racionales, sino también en el campo de números reales; sin embargo, 
se hace reducible en el campo de números complejos, puesto que 


24 1=(—i) (240. 


Indiquemos unas cuantas propiedades fundamentales de los 
polinomios irreducibles, recordando que se trata de polinomios 
irreducibles en el campo P. 

a) Todo polinomio de primer grado es irreducible. 

En efecto, si este polinomio se descompusiese en un producto 
de factores de menor grado, éstos tendrían que ser de grado cero. 
No obstante, el producto de cualesquiera polinomios de grado cero 
es de nuevo un polinomio de grado cero, y no de grado uno. 

P) Si el polinomio p (z) es irreducible, lo es también cualquier 
polinomio cp (x), donde c es un elemento de P diferente de cero. 

Esta propiedad es consecuencia de las propiedades I y VII $ 21 
y nos permitirá limitarnos, allí donde hiciese falta, al estudio de 
los polinomios irreducibles cuyos coeficientes superiores sean iguales 
a la unidad. 

y) Si f (æ) es un polinomio arbitrario y p (x) es un polinomio 
irreducible, entonces f (x) es divisible por p (2), o estos polinomios son 
primos entre sí. 

Si (f (x), p (2) = d (x), el polinomio d (z), siendo divisor del 
polinomio irreducible p (z), es de grado O o bien es un polinomio 
de la forma cp (2), c+ 0. En el primer caso, f (x) y p (2) son primos 
entre sí, en el segundo, f(x) es divisible por p (x). 

ô) Si el producto de los polinomios f (x) y g (x) es divisible por un 
polinomio irreducible p (x), al menos uno de estos factores es divisible 
por p (z). 

En efecto, si f (z) no es divisible por p (2), según y), f (2) y p (2) 
son primos entre sí, y, entonces, según la propiedad b) del $ 21, 
el polinomio g (z) tiene que ser divisible por p (z). 

La propiedad ô) se generaliza sin dificultad al caso del producto 
de cualquier número finito de factores. 

Los dos teoremas que siguen son el objeto principal del presente 
párrafo. 

Todo polinomio f (z) de grado n, n>1, del anillo P [x], se des- 
compone en un producto de factores irreducibles. 

En efecto, si el mismo polinomio f (z) es irreducible, el producto 
indicado consta de un solo factor. Si es reducible, se puede descompo- 
ner en un producto de factores de menor grado. Si entre estos factores 
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hay de nuevo reducibles, efectuamos la descomposición siguiente en 
factores, etc. Este proceso tiene que terminarse después de un número 
finito de ensayos, pues, sea cual fuese la descomposición de f (2) 
en factores, la suma de sus grados tiene que ser igual a n, por lo 
que el número de factores que dependen de z no puede ser mayor 
que n. 

La descomposición de los números enteros en factores primos 
es única, si nos limitamos a considerar los números enteros posit: 
vos. Sin embargo, en el anillo de todos los números enteros la uni- 
cidad subsiste, salvo el signo: así pues, —6 = 2.(—3) = (—2)-3, 
10 = 2:5 = En el anillo de los polinomios nos 
encontramos con una situación análoga. Si 


Fx) = Pi (2) peke) -Pa (2) 


es una descomposición del polinomio f (z) en un producto de factores 
irreducibles y si los elementos c4, ĉz, . » =, €, del campo P son tales 
que su producto es igual a 1, entonces en virtud de $), 


H2) = lerm (P) lc2po (2)1 leaps (e) 


también será una descomposición de f (x) en un producto de factores 
irreducibles. Con éstas se agotan todas las descomposiciones de f (2): 

Si un polinomio f (x) del anillo P |x] se descompone de dos modos 
en un producto de factores irreducibles: 


f (2) = pi (2) pa (1) + Pa (2) = gi (2) qa (2) + a, (2) 


entonces, s = t y, con una numeración adecuada, se verifican las igual- 


dades: 
air) = cipi (£), i eos (3) 


donde c; son elementos del campo P diferentes de cero. 

Este teorema subsiste para los polinomios de primer grado, pues, 
éstos son irreducibles. Por lo tanto, la demostración se hará emplean- 
do el método de inducción sobre el grado del polinomio, es decir, 
se demostrará el teorema para f (z), suponiendo que ya está demostra- 
do para los polinomios de menor grado. 

Como q (2) es divisor de f (x), en virtud de la propiedad ô) y de 
la igualdad (2), q, (x) será divisor por lo menos de uno de los poli- 
nomios p; (x), por ejemplo, de p, (z). Mas, como el polinomio p, (2) 
es irreducible y el grado de pı (z) es mayor que cero, existe un ele- 
mento c, tal que 


q (2) = cp: (2) (4) 


Poniendo en (2) esta expresión de qı (2) y simplificando por p; (2) 
(lo cual se permite, puesto que en el anillo P (xl no hay divisores 
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de cero), se obtiene la igualdad 
Poke) pate). pata) le (a) (a) > q o) 


Como el grado del polinomio que es igual a estos productos, es menor 
que el grado de f (2), q ya demostrado que s — 1 ti, 
de donde s — £, y que existen unos elementos cp, Ca, + -., Cs, tales 
que espa (2) — Cige (2), de donde ge (2) (04 c4) pa (2), y cip: (2) 

mí), i- 3,..., s. Haciendo e e, — cz y teniendo en cuenta 
(4). obtenemos la igualdad (3). 

El teorema que acabamos de demostrar se puede enunciar más 
brevemente: todo polinomio se descompone en factores irreducibles 
de un modo único, salvo factores de grado cero. 

Por cierto, siempre se puede considerar la descomposición de la 
siguiente forma especial, que para cada polinomio ya es completa- 
mente única: se toma cualquier descomposición del polinomio / (x) 
en factores irreducibles y de cada uno de estos factores se saca fuera 
de paréntesis su coeficiente superior. Se obtiene la descomposición 

F(a) = aop, (e) pala) <. PAD, (5) 
donde todos los p; (2), i = 4, 2, +. ., s, son polinomios irreducibles 
enyos coeficientes superiores son iguales a la unidad. El factor ao 
será igual al coeficiente superior del polinomio f (z), lo que se 
comprueba fácilmente efectuando las multiplicaciones en el segundo 
miembro de la igualdad (5). 

Los factores irreducibles que form. 
(5), no son todos necesariamente dist 
cible p (2) figura unas cuantas veci 
Mama factor múltiple de f (x): precisamente, k es el orden de multi- 
plicidad, si en la descomposición (5) hay exactamente k factores 
iguales a p (z). Si el factor p (z) figura en (5) una sola vez, se llama 
factor simple (el orden de multiplicidad es igual a uno) de f (2). 
en la descompo: (5) los factores p; (2), pa (2), - + pi (2) 
son distintos entre sí y cualquier otro factor es igual a uno de éstos, 
siendo ki, i= 1, 2,..., Z, el orden de multiplicidad del factor 
pi (x), la descomposición (5) se puede escribir en la forma siguiente: 

f @) = aop} (2) pte (2) -~ Pa). (6) 
A continuación se utilizará, por lo general, esta expresión, sin 
advertir ya que los exponentes son los órdenes de multiplicidad 
de los factores respectivos, es decir, que p; (2) + pj (2) para i + j. 

Dadas las descomposiciones de los polinomios f (+) y g (2) en factores 
irreducibles, el máximo común divisor d (z) de estos polinomios es igual 
al producto de los factores que figuran simultáneamente en ambas 
descomposiciones, elevado cada factor a una potencia igual al mínimo 
de los órdenes de su multiplicidad en ambos polinomios. 


a parte de la descomposición 
tos. Si el polinomio irredw- 
en la descomposición (5), se 
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En efecto, el producto indicado es divisor de cada uno de los 
polinomios f (z) y g (2), y, por esto, lo es también de d (z). Si este 
producto fuese distinto de d (z), en la descomposición de d (z) en facto- 
res irreducibles estaría contenido un factor que no figura en la des- 
composición de alguno de los polinomios f (2) y g (z), lo cual es 
imposible, o bien, uno de los factores estaría clevado a una mayor 
potencia que la que tiene en la descomposición de alguno de los poli- 
nomios f (z) y g (z), lo cual, de nuevo, es imposible. 

Este teorema es análogo a la regla según la cual se busca ordi 
nariamente el máximo común divisor de los números enteros. Sin 
embargo, este teorema no puede sustituir al algoritmo de Euclides 
en el caso de los polinomios. En efecto, como sólo hay un número 
finito de números primos menores que un número entero positivo 
dado, la descomposición de un número entero en factores primos 
se consigue mediante un número finito de ensayos. Esto ya no se 
verifica en el anillo de los polinomios sobre un campo fundamental 
infinito y, en el caso general, no se puede señalar un método para 
la descomposición prá de los polinomios en factores irreducibles. 
Incluso la resolución del problema para averiguar si el polinomio 
1 (a) es irreducible en un campo dado P, en el caso general, es muy 
difícil. Así pues, la descripción de todos los polinomios irreducibles 
para el caso de los campos de números complejos y reales fue obteni- 
da en el $ 24 como consecuencia de un teorema muy importante de 
existencia de la raíz. En lo que se refiere al campo de números racio- 
nales, se harán solamente algunas proposiciones de carácter particu- 
lar en el $ 56 con respecto a los polinomios irreducibles sobre este 
campo 

Hemos demostrado que en el anillo de los polinomios 
anillo de los números enteros, subsiste la descomposici 
(irreducibles)* y que esta descomposición en cierto sentido es única. Surgo la 
pregunta, ¿so pueden generalizar estos resultados a clases de anillos 1m 
amplios? En esto caso nos limitaremos a considerar anillos conmutativos que po- 
sean unidad y no contengan divisores de cero. 

Llamaremos divisor de la unidad a un elemento a del anillo para el que oxis- 
te en illo el elemento recíproco a-t, 


igual que en el 
bn factores «primos» 


arisi. 


En el anillo de los números enteros, éstos son los números 1 y —1; en el anillo 
de los polinomios P [z]. todos los polinomios de grado cero, o sea, los números 
del campo P, distintos Un elemento e diferente de cero, qu x 
sor de la unidad, se lama elemento primo del anillo, si en cualquiera de sus des- 
os factores, e no de estos factores es 
jad. En el anillo de los números enteros son 
s primos los números primos, en el anillo de los polinomios, los polino- 
mios irreducibles. 
¿Se descompone en un producto de factores primos cualqu 
anillo considerado, que no sea divisor de la unidad y sea diferen 


. (Nota del To. 


r elemento del 
de cero? En 


* Llamada descomposición factori 
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caso de afirmacion, ¿será única tal descomposición? Esto último hay que enten- 
derlo en el sentido siguiente: si 

a= PiPa -+ PRh= Q92 +=- N 
son dos descomposiciones del elemento a en factores primos, entonces, k =1 
y (posiblemente, después de cambiar la numeraci 


GSP i=, Zeek 


donde c: es divisor de la unidad. 
En el caso general, ambas preguntas tienen una respuesta negativa. Aquí 
nos limitaremos con un ejemplo; indicaremos un anillo en el que la descom- 
posición en factores primos, aunque es posible, no es única, 
Examinemos los números complejos de la forma 


a=a- Y=3, o 


donde a y b son números enteros. Todos estos números forman un anillo 
sin divisores de cero que contiene la unidad; en efecto, 


lab V=) le 4d V=3) = (ac 30d) + (be pad) V=3. (5 

Llamemos norma del número a= a+b Y =3 al m 
N(a)- al; 3b. 

En virtud de (8), la norma del producto es igual al producto de las normas 


de los factores. 
Wap) =N (a) N (B). cu 


ero entero pa 


En efecto, 
(ac— 3b)? 3 (bej ad)? — a?e |- 902e? 4- 303c? Za? 
= (a 4 30%) (c2 4-343). 


Si en nuestro anillo el número æ es divisor de la u 

a~t también tiene la forma (7), entonces, por (9), 
N (a)-N (a71) = N (aa) —N (1) 

+ N (a) = 1, pues los números A (2) y N (a1) son enteros y positi 

A se deduce que 

a? 4-3021; 

sin embargo, esto es posible sólo cuando b = 0, a = + 1. Por lo tanto, en nues- 

tro anillo, asi como en el anillo de los números enteros, son divisores de la unidad 

solamente los números A y —1 y solamente estos números tienen la norma igual 

a la unidad. 

Naturalmente, la igualdad (9) para la norma del producto se generaliza 
para el caso de un número finito de factores. De aquí fácilmente se deduce que 
todo número a de nuestro anillo se puede descomponer en un producto de un núme- 
ro finito de factores primos; la demostración se la dejamos al lector. 

No obstante, ya no se puede afirmar que la descomposición en factores pri- 
mos es única. Por ejemplo, se cumplen las igualdades. 


4-22-(14+V-3) 4—V=3). 
En nuestro anillo no hay otros divisores de la unidad más que los números 1 y—4, 
por lo que el número 1-: /—3 (así como el número 1 — /—3) no puede dife- 


renciarso del número 2 solamente en un factor que sea divisor de la unidad. No 
queda más que demostrar que en el anillo considerado, cada uno de los números 


jad, o sea, que el número 


de aquí qı 
vos. Sia=a 
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2,14 V73, 1 — ys es primo. En efecto, la norma de cada uno de estos 
tres números es igual al número 4. Sea œ uno de estos números y supongamos que 
a—=By. 

Entonces, según (9), es posible uno de los tres casos: 

DNS Np=1 2 NB N= 

3) N (B)=N 0) =2. A a È 
En el primer caso, como ya sabemos, el número y es divisor de la unidad, en el 
segundo caso, el divisor de la unidad es $. En lo que se refiere al tercer caso, éste 
es imposible, en general, puesto que, para enteros a y b, la igualdad 


a?i 32 


es imposible. 


Factores múltiples. A pesar de que más arriba se indicó que 
no sabemos descomponer los polinomios en factores irreducibles, 
existen métodos para saber si un polinomio dado posee factores 
múltiples o no, y, en caso de una respuesta positiva, éstos permiten 
reducir el estudio de este polinomio al estudio de otros que ya no 
poseen factores múltiples. Sin embargo, estos métodos exigen la 
imposición de ciertas restricciones al campo fundamental. Preci- 
samente, todo el contenido ulterior del presente párrafo se va a expo- 
ner suponiendo que la característica del campo P es cero. Sin esta 
restricción, los teoremas sobre los factores múltiples que se demos- 
trarán a continuación, pierden su valor; además, desde el punto 
de vista de las aplicaciones, el caso de campos de característica 
cero es el más importante, pues, incluye a todos los campos numé- 
ricos, 

Obsérvese primero que el concepto de derivada de un polinomio, 
introducido en el $ 22 para los polinomios de coeficientes complejos, 
y las propiedades principales de este concepto, también se generalizan 
para el caso considerado *. Demostremos ahora el siguiente teorema: 
i p (x) es un factor irreducible múltiple de orden k, k>1, del 
polinomio f (x), entonces, es también un factor múltiple de orden (k — 1) 
de la derivada de este polinomio. En particular, un factor simple del 
polinomio no figura en la descomposición de la derivada. 

En efecto, supongamos que 


42) = p* (2) g (2), (10) 
ible por p(z). Derivando la igualdad (10), 


donde g(x) ya no es di 
resulta; 


PO PEO H kpt o) p' (2) g (2) 
pot (x) Ip (o) el (2) + kp’ (e) g (2)1- 

El segundo término que fig atre paréntesis no es divisible por 

p (£); en efecto, g (2) no es e por p (2) según la hipótesis y 


icterística finita carece de valor la afirmación de 
omio de grado n es de grado n—1. 


* Para los campos de ca 
que la derivada de un pol 
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p’ (x) es de grado menor, o sea, tampoco es divisible por p (2). De 
aquí, en virtud de la irreducibilidad del polinomio p (z) y de las 
propiedades ô) del presente párrafo y IX del $ 21, resulta nuestra 
afirmación. Por otra parte, el primer término que figura entre cor- 
chetes es divisible por p (2), por lo cual, toda esta suma no puede 
ser divisible por p (2), o tor p (2) figura, efectivamente, 
en f’ (2) con la multiplicidad Æ — 1. 

De nuestro teorema y del método indicado anteriormente para 
la averiguación del máximo común divisor de dos polinomios, se 
deduce que, dada la descomposición del polinomio f (z) en factores 
irreducibles 


10) = aop (2) p(o) PO, (1) 


el máximo común divisor del polinomio f (x) y su derivada posee la 
siguiente descomposición en factores irreducibles: 
VOTO O o, (12) 
en la que, naturalmente, si ky 1, el factor pj” (z) se debe sus 
tuir por la unidad. En particular, el polinomio f (x) no contiene facto- 
res múltiples cuando, y sólo cuando, éste es primo con su derivada. 

Por consiguiente, hemos aprendido a ponder a la pregunta 
sobre la existencia de factores múltiples de un polinomio dado. 
Además, como la derivada de un polinomio, así como el máximo 
común divisor de dos polinomios, no dependen de que se considere 
el campo P o cualquiera de sus ampliaciones P, como consecuencia 
del resultado que acabamos de demostrar obtenemos que: 

Si un polinomio f (x) con coeficientes de un campo P de caracte- 

rística cero, no tiene sobre este campo factores múltiples, no los tendrá 
tampoco sobre ninguna ampliación P del campo P. 
En particular, si f (x) es irreducible sobre P, y Pesalguna amplia- 
n del campo P, entonces, aunque f (2) pueda ser ya reducible 
sobre P, no puede ser divisible por el cuadrado de un polinomio 
irreducible (sobre P). 

Separación de los factores múltiples. Dado un polinomio f (2) con 
la descomposición (11) y designando con d, (x) el máximo común 
divisor de f (z) y su derivada f’ (z), la expresión (12) representa la 
descomposición de d, (z). Dividiendo (11) por (12), resulta: 


dp, 


o sea, obtenemos un polinomio que carece de factores múltiples. 
Además, cualquier factor irreducible de v, (z) es también factor 
de f (z). Con esto, la averiguación de los factores irreducibles de 
f (x) se reduce a la averiguación de los mismos para el polinomio 


c 


E 


LN ant) 


v, (z), que, por lo general, es de menor grado y contiene solamente 
factores primos. Resolviendo este problema para v; (z), no queda 
más que determinar la multiplicidad en f (x) de los factores irre- 
ducibles hallados, lo cual se consigue aplicando el algoritmo de la 
división. 


Generalizando el método que acabamos de exponer, se puede pasar a exami- 
inmediatamente unos cuantos polinomios sin factores múltiples, Hallando 
sus factores irreducibles, no sólo obtenemos todos los factores irreducibles de 
1 (a), sino también sus órdenes de multiplicidad. 

Sea (11) la descomposición de f (2) en factores irreducibles y s, s > 1, ol 
orden superior de multiplicidad de los factores. Desi 


eos, / (2) es divisible por la k- 
2, «00. s, y la descomposición (11) la forma 


HO ED PD FAO FO, 

ición (12) para dy (2) -4 (2), f' (2) se escribe asi: 
dy (2) Pat) FO +. POE). 

Designanda con da (2) el 


y su derivada y, en general, com da (2), 
polinomios dy 4 (2) Y dy (o), obtenemos: 


dela) -Fa (a) FA (a) 0. F 
dyla) Fle) FIS o F 


y la descomy 


n divisor del polinomio dy (2) 
ximo común divisor do" los 


det) Fo 


n a 
De aquí que 
to LE ah Falo Esta a to, 
min HO ro Paa) a Pela. 
"ata ide PAD 


ra (a) 


y, finalmente, 


Fio as Fala) vala) 


Por lo tanto, aplicando sólo métodos que 
factores irreducibles de f (z), como la 
de Euclides y del algoritmo de la div 


exigen el conocimiento de los 
vación. la aplicación del algoritmo 
ión, se pueden hallar los polinomi 
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Fila), Fela), -. Ez) que carecen de factores múltiples, siendo cada factor 
irreducible del polinomio Fa (z), k = 1, 2, .... s, un factor de f(z) de orden k. 
El método expuesto no Se puede considerar como método de descomposición 
de un polinomio en factores irreducibles, pues, para s = f, es decir, para un 
polinomio sin factores múltiples se obtendría solamente f(z) = F, (2). 


$ 49. Teorema de existencia de la raíz 


El teorema fundamental demostrado en el $ 23, sobre la existen- 
cia do una raíz en el campo de números complejos para cualquier 
polinomio numérico, no se puede generalizar para el caso de un campo 
arbitrario. En el presente párrafo se va a demostrar un teorema que, 
en cierta medida, sustituye en la teoría general de Jos campos al 
teorema fundamental indicado del álgebra de los números complejos. 

Sea dado un polinomio f (z) sobre el campo P. Surge la pregunta: 
¿existe alguna ampliación P del campo P en la que f (2) tenga ya 
por lo menos una raíz, si el polinomio / (z) carece totalmente de 
raíces en el campo P? Aquí se puede suponer que el grado de / (2) 
es mayor que la unidad, pues, para los polinomios de grado cero la 
pregunta no tiene sentido y cualquier polinomio de primer grado 


az + b tiene la raíz —2 en el mismo campo P. Por otra parte, 


está claro que podemos limitarnos al caso en que el polinomio f (z) 
sea irreducible en el campo P, puesto que, en caso contrario, la raíz 
de cualquiera de sus factores irreducibles serviría de raíz para sí 
mismo. 

La respuesta nos la da el siguiente teorema de existencia de la raíz: 

Para cualquier polinomio f (x), irreducible sobre el campo P, existe 
una ampliación de este campo en la que está contenida una raíz de 
f (2). Todos los campos mínimos que contienen al campo P y a alguna 
raíz de este polinomio, son isomorfos entre si. 

Demostremos primero la segunda mitad del teorema. 

Sea dado un polinomio 

10) =a" ar". o. ap ¡8H an, (0) 


n>2, irreducible sobre P, de modo que f (x) no tiene raíces en el 
mismo campo P. Supongamos que existe una ampliación P del 
campo P, que contiene una raíz a de f (z), y demostremos el siguien- 
te lema que, además de ser necesario para nuestra demostración, 
es también de interés particular: 

Si la raíz a, perteneciente a P, de un polinomio j (x) irreducible 
en P, es también raíz de un polinomio g (z) del anillo P 12), entonces 
f (2) es un divisor de g (2). 

En efecto, en el campo P los polinomios f (z) y g (2) tienen un 
común divisor, z — œ, por lo que no son primos entre sí. No obstante 
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la propiedad de los polinomios de no ser primos entre sí no depende 
del campo que se haya elegido, por lo cual, se puede pasar al campo 
P y aplicar la propiedad y) del párrafo anterior. ES 
Hallemos ahora el subcampo mínimo P (x) del campo P que 

contiene al campo P y al elemento æ. Ante todo, al campo buscado 
pertonecen todos los elementos de la forma 

B=bo+ biat batt... bar, (2) 
donde bo, bs, ba, - . ., Ùn-s son elementos del campo P. Ningún 
elemento del campo P puede poseer dos expresiones distintas de la 
forma (2), pues si se cumpliese también la igualdad 

B=co +0 atar... eran, 


donde por lo menos para un A fuese caba, a sería raíz del poli- 
nomio 


g(a) = (do co) + (bici) t+ (bz— ea) 2t- a — Cp 27t, 
lo cual contradice al lema demostrado anteriormente, puesto que 
el grado de g (x) es menor que el de f (2). 

Entre los elementos del campo Ž que tienen la forma (2), figu- 
ran todos los elementos del campo P (cuando b; == ha s$ 

ba- ~ O), y también el mismo elemento a (cuando b, = 1, 
bo = be =... = ba- = 0). Demostremos que los elementos de la 


jorma (2) jorman todo el subcampo P (a) buscado. En efecto, dados 
el elemento f (con la expresión (2) y 


y=C0) +00 cat. 


Pear, 


en virtud de las propiedades do las operaciones en el campo P, 
se tiene 


B y= (bo £ co) + (bi £ ci) a + (ba e)a... + (bni E Cni) a" 


o sea, la suma y la diferencia de dos elementos cualesquiera de la 
forma (2) son de nuevo elementos de la misma forma. 
Multiplicando $ por y resulta una expresión que contiene a a" 
y a potencias más superiores de æ. Sin embargo, de (1) y de la igual- 
dad f (u) =0, se deduce que a” y, por lo tanto, ar, art, ete, se 
pueden expresar mediante potencias menores del” elemento æ. 
EL método más simple para hallar la expresión de fp consiste en 
lo siguiente: sean 
ql) =bo Hb ol, P(A ea, 


de donde, p()=B, (a) —y. Multiplicando los polinomios y (z) 
y (x) y dividiendo este producto por f(x), resulta 


P (z) p(z) =f (£)g (2) 4 r (2), 6 
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donde 
TO) = dy idd o y a” 


Hallando los valores de ambos miembros de la igualdad (3) para 


<a, resnila: 
pa Mula) © ria), 
o sea, como f(a) U, 


y dadas ida 


Porlo tanto, e) producto de dos elementos de la forma (2) es de puevo 
un elemento de la misma form: 

Demostcemos, finalmente, que si el elemento Bes de la forma (2) 
y B # 0, el elemento P, que existe en el campo P, también se puede 
expresar en la forma (2). Para esto, tomemos el polinomio 

P= lyi irinn la 

del anillo P æ}. Como el grado de q (r) es inferior ab de / (2) y el 
polinomio f (z) es irreducible sobre 2. los polinomios y (2) y To 
son primos entre si y, ea virtud de los $$ 24 y 47, en el anillo 
P \r] existen unos polinomios u (1) y v (1) tales que 


(0) u (2) + f (r) e TH 


además, se puede suponer que el grado de u (z) es menor que m: 


u (2) sot set... E Sat 

De aquí, en virind de Ja igualdad f({a)=0, resuhta: 
q (æ) u(a) -+ 1; 

por esto, debido a la igualdad q (a) =f, se 

p% ula) 


Por lo tanto, el conjunto de los elementos del campo P que tienen 
la forma (2) forman un subcampo del campo /; éste será el campo 
buscado P (a). Como hemos visto, para hallar la suma y el producto de 
los elementos $ y y de la forma (2) solamente hay que conocer los 
cooficientes de las expresiones de estos elementos mediante las 
potencias de œ, por lo cual, se puede afirmar que subsiste el resul- 
tado siguiente: si además de P existe otra ampliación P del campo 
P que contiene también una raíz a” del polinomio f (z), y si P (a) 
es el subeampo mínimo del campo P’ que contiene a P y a al, los 
campos P (a) y P (a) son isomorfos, donde, para obtener la correspon- 
dencia de isomorfismo entre ellos hay que asociar al elemento P 
de la forma (2) de P (a) el elemento 


Be bot bya + ba 


ne: 


kid at, 


L 
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de P (a) que tiene los mismos coeficientes. Con esto, queda demos- 
trada la segunda mitad del teorema. 

Pasemos ahora a demostrar la primera mitad de este teorema, 
que es lą fundamental; lo expuesto anteriormente nos indicará el 
camino a seguir. Dado un polinomio f (z) de grado n > 2, irreducible 
sobre el campo P, se necesita construir una ampliación del campo 
P que contenga una raíz de f (z). Consideremos para esto todo el 
anillo de los polinomios P [xl y dividámosle en clases disjuntas, 
incluyendo en una clase a los polinomios que al ser divididos por 
el polinomio dado f (x) proporcionen residuos iguales. En otras 
palabras, los polinomios «y (x) y y (z) pertenecerán a una misma 
clase, si su diferencia es divisible por f (z). 

Convengamos en designar las clases obtenidas con las letras 
A, B, C, ete, y definamos la suma y el producto de las clases del 
siguiente modo. Tomemos dos clases cualesquiera A y B; elijamos 
en la clase A algún polinomio q, (z), en la clase B, algún polinomio 
ip (2), y designemos con z: (z) la suma de estos polinomios, 


X (2) = 4 (2) + pi (2), 
y con 0,(2), su producto 
O (2) = 912) Y (2). 
A cualquier otro polinomio q (2), en la 


o Ya (2). y designemos respectivamente 
y producto: 


Elijumos ahora en la el 
clase B, cualquier pol 
con Ya (2) y 02(2) su sul 

Xa lr) = qa (2) + e (2). 

Ba (2) = 42 (2) Y2 (2). 
Según la condición, los polinomios qı (2) y e (2) pertenecen a una 
misma clase A, por lo cual su diferencia q, (z) — 2 (2) es divisible 
por f (z); la diferencia y, (2) — we (2) posee esta misma propiedad. 
De aquí que la diferencia 
Ya (2) — Xe (2) = lpi (2) i pi (£) — [602 (2) + pa (20) 1 = 

= [pi (2) — pa (2) H bpa (0) — 2 (01 (4) 
también es divisible por el polinomio / (z). Esto mismo se cumple 
también para la diferencia 0, (2) —0. (z), puesto que 
O; (æ) — Oz (2) — 601 (2) Ya (2) — Qe (2) p (2) = 
== tpa (2) pa (0) — 1 (2) pe (£) + pi (2) Pa (2) — Pa (2) a (2) = 

a (æ) O) — e (014 laa 0) — 0 (pe (e). (5) 


La igualdad (4) muestra que los polinomios %ı (2) y Xe (2) están 
situados en una misma clase. En otras palabras, la suma de cualquier 
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polinomio de la clase A y cualquier polinomio de la clase B pertene- 
ce a una clase C completamente determinada, que no depende de los 
polinomios que se hayan elegido como «representantes» de las cla- 
ses A y B; llamemos a esta clase C, suma de las clases A y B: 


C=A+B. 


Análogamente, en virtud de (5), no depende tampoco de la 
elección de los representantes en las clases A y B la clase D, a la que 
portenece el producto de cualquier polinomio de A por cualquier 
polinomio de B; llamemos a esta clase, producto de las clases A y B: 


D= AB. 


Demostremos que el conjunto de clases en que se ha dividido 
nuestro anillo de polinomios P [z], después de haber introducido 
las operaciones anteriores de suma y producto, se convierte en un 
campo. En efecto, el cumplimiento de las leyes asociativa y conmu- 
tativa para ambas operaciones y de la ley distributiva es consecuencia 
de la subsistencia de estas leyes en el anillo P (xl, puesto que las 
operaciones con las clases se reducen a las operaciones con los poli- 
nomios situados en estas clases. Evidentemente, la clase formada 
por los polinomios que son divisibles por el polinomio f (x) desem- 
peña el papel del cero. Esta se denominará clase cero y se designará 
con el símbolo O. La opuesta a la clase A, formada por los polino- 
mios que al ser divididos por f (z) dan un residuo q (z), será la clase 
formada por los polinomios que al ser divididos por f (z) dan el 
residuo —ọ (z). De aquí se deduce que en el conjunto de los polino- 
mios es posible la resta, siendo ésta unívoca. 

Para demostrar que es posible la división en el conjunto de las 
clases, hay que mostrar que existe una clase que desempeña el papel 
de la unidad y que existe una clase recíproca para cualquier clase 
distinta de la clase cero. La unidad es evidentemente la clase de los 
polinomios que al ser divididos por f (z) dan un residuo igual a 1; 
a ósta la llamaremos clase unidad y la designaremos con la nota- 
ción E. 

Sea dada ahora una clase A, distinta de la clase cero. Por consi- 
guiente, un polinomio q (z), elegido en la clase A como representan- 
te, no será divisible por f (z) y, como el polinomio f (z) es irreduci- 
ble, estos dos polinomios serán primos entre sí. Por lo tanto, en el 
anillo P [z] existen unos polinomios u (z) y v (z) que satisfacen 


a la igualdad 
e (z)u (2) +f (æv (=)= 
Y (r)u (7)=1— f (2) v (2). (6) 


El segundo miembro de la igualdad (6), al ser dividido por f (z), 
da un residuo igual a 1 y, por lo tanto, pertenece a la clase unidad Æ. 


de donde 
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Designando con B la clase a que pertenece el polinomio u (z), la 
igualdad (6) muestra que 
AB=E, 


de donde B — A”. Con esto queda demostrada la existencia de una 
clase inversa para cualquier clase distinta de la clase cero, es decir, 
queda terminada la demostración de que las clases forman un campo. 

Designemos este campo mediante P y demostremos que éste es una 
ampliación del campo P. A cada elemento a del campo P le correspon- 
de la clase formada por los polinomios que al dividirlos por f (z) 
dan un residuo igual a a; el mismo elemento a, considerado como 
un polinomio de grado cero, pertenece a esta clase. Todas las clases 
de esta forma especial forman en el campo P un subcampo isomorfo 
al campo P. En efecto, es evidente que la correspondencia es biuní- 
voca; por olra parte, en estas clases se pueden elegir como repre- 
sentantes los elementos del campo P y, por consiguiente, a la suma 
(producto) de los elementos de 2 le va a corresponder la suma (pro- 
ducto) de las clases correspondientes. En consecuencia, tenemos 
derecho de no hacer diferencia entre los elementos del campo P 
y las clases que les corresponden. 

Por último, designemos con X la clase formada por los polino- 
mios que al ser divididos por f (2) dan un residuo igual a y. Esta 
clase es un elemento del campo P completamente determinado, 
y queremos demostrar que este elemento es raíz del polinomio f (+). Sea 


1(2) a" Haa" o. o H anaE po 


Designemos mediante A; la clase que corresponde, en el sentido 
indicado anteriormente, al elemento a; del campo P, i O, 1, +... 
- + n y veamos a qué es igual el elemento 


AAA cb XHA (m 


del campo P. Tomando los elementos 4, ¿+= 0, 4, ..., n, por 
representantes de las cl: A, y el polinomio z por representante 
de la clase X, y aplicando la definición de suma y producto de las 
clases, obtenemos que el mismo polinomio f (z) está contenido en 
la clase (7). Pero, f (z) es di le por sí mismo, de donde resulta 
que (7) es la clase cero. Sustituyendo en (7) las clases A; por sus 
elementos correspondientes a; del campo P, obtenemos que en el 
campo P se verifica la igualdad 


ax ay xn -FAnaX 4440, 


o sea, la clase X es verdaderamente raíz del polinomio f (2). 
Con esto queda terminada la demostración del teorema de exis 
tencia de la raíz. Obsérvese que, tomando por P el campo de los 


Ay 
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reales y poniendo f (z) — z? +1, resulta otro método más de cons- 
trucción del campo de los números complejos. 

Del teorema de existencia de la raíz se pueden deducir conse- 
cuencias análogas a las que se dedujeron del leorema fundamental 
del álgebra de los números complejos (véase $ 24). Hagamos pri- 
mero una observación. Como.cada factor lineal « — c del polinomio 
f (2) es irreducible, éste tiene que figurar en la descomposición única 
en factores irreducibles que posee f (2). 

Sin embargo, el número de factores lineales que hay en la 
descomposición de j (z) en factores irreducibles no puede superar 
al grado de este polinomio. Así, llegamos al siguiente resultado: 

Un polinomio f (x) de grado n no puede tener en el campo P más 
de n raíces, incluso si cada raíz se cuenta tantas veces como indique su 
orden de multiplicidad. 

Llamemos campo de descomposición del polinomio f (£) de grado 
n sobre el campo P a una ampliación Q del campo P en la que estén 
contenidas n raíces de f (x) (contando las raíces múltiples tantas 
veces cuantas indiquen sus órdenes de multiplicidad). Por consiguien- 
te, el polinomio f (z) se descompone sobre el campo Q en factores 
lineales. Además, ninguna otra ampliación del campo Q puede dar 
lugar a la aparición de nuevas raíces de f (2). 

Para cualquier polinomio f (x) del anillo P (xl, existe sobre el cam- 
po P un campo de descomposición. 

En efecto, si el polinomio f (x) de grado n, n>1, tiene n raíces 
en el mismo campo P, éste será el campo buscado de descomposi- 
ción. Si f (2) no se descompone sobre P en factores lineales, tomamos 
uno de sus factores irreducibles no lineales q (x) y, basándose en 
el teorema de la existencia de la raíz, ampliamos 2 hasta obtener 
un campo P” que contenga una raíz de ọ (x). Si el polinomio f (x) 
no se descompone todavía sobre P” en factores lineales, ampliamos 
de nuevo el campo, creando una raíz para otro de los factores irre- 
ducibles no lineales que queden. Evidentemente, después de un 
número finito de operaciones, llegaremos a obtener para f (x) un 
campo de descomposición. 

Está claro que / (z) puede poseer muchos campos distintos de 
descomposición. Se podría demostrar que todos los campos míni- 
mos que contienen al campo P y a las n raíces del polinomio f (x) 
(donde n es el grado del polinomio), son isomorfos entre sí. Como 
esta proposición no va a ser utilizada a continuación, no expondremos 
su demostración. 

Raíces múltiples. En el párrafo anterior se había demostrado 
que un polinomio f (z), dado sobre un campo P de característica 0, 
no tiene factores múltiples cuando, y sólo cuando, es primo con su 
derivada; también se había señalado que la carencia de factores 
múltiples de / (x) sobre el campo P implica la carencia de factores 
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de este tipo sobre cualquier ampliación P del campo P. Aplicando 
esto al caso en que P sea un campo de descomposición para f (x) 
y recordando la definición de raíz múltiple, llegamos al resultado 
siguiente: 

Si un polinomio f (2), dado sobre un campo P de característica 0, 
no tiene raices múltiples en un campo dado de descomposición, éste 
es primo con su derivada f’ (x). Recíprocamente, si f (x) es primo con 
su derivada, entonces no tiene raíces múltiples en ninguno de sus cam- 
pos de descomposición. 

En particular, de aquí se deduce que un polinomio f (x) irre- 
ducible sobre un campo P de característica O, no puede tener raíces 
múltiples en ninguna ampliación de este campo. Esta proposición deja 
de ser cierta para los campos de característica finita, circunstancia 
que desempeña un papel notable en la teoría general de los campos. 

En conclusión, obsérvese que para el caso de un campo arbitrario 
e conservan también las fórmulas de Vieta (véase el $ 24); en este 
caso, las raices del polinomio se toman en un campo de descomposi- 
ción del mismo. 
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La teoría de las fracciones racionales, expuesta en el $ 25, se con- 
serva también totalmente en el caso de un campo fundamental arbitri 
rio. Mas al pasar del campo de los números un campo arbi- 
Ln 
K) 


se considera 


trario P, el punto de vista según el cual la expres 


como una función de la variable z, tiene que ser desechado, puesto 


que, como ya se sabe, éste ya no es aplicable a los polinomios. Ante 
nosotros se plantea el problema de determinar el sentido que hay 
que atribuir a estas expresiones cuando los coeficientes pertenecen 
a un campo arbitrario P. Más exactamente, queremos construir un 
campo en el que esté contenido el anillo de los polinomios P |l. 
pero de modo que las operaciones de suma y producto definidas en 
este nuevo campo, al ser aplicadas a los polinomios, coincidan con 
las operaciones en el anillo # [z]; abreviando, el anillo P [x] tiene 
que ser un subanillo de este campo nuevo. Por otra parte, todo ele- 
mento de este nuevo campo tiene que representarse (en el sentido 
de la división en este campo) en forma de un cociente de dos poli- 
nomios. Como ahora se enseñará, tal campo puede ser construido 
para cualquier P; se designará con la notación P (z) (obsérvese que 
la indeterminada está encerrada entre paréntesis) y se llamará campo 
de fracciones racionales sobre el campo P. 

Supongamos primero que el anillo P jz) ya es un subanillo de 
cierto campo Q. Si f (z) y g (x) son polinomios arbitrarios de 2 |l, 
siendo g (z) Æ 0, existe en el campo Q un elemento univocamente 
determinado, igual al cociente de la división de f (z) por g (2). 
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Designando este elemento, como ordin: 
de un campo mediante L2 a + en virtud de la definición del cociente, 
ibir la igualdad 

10-02, 0 


donde el producto se debe entender en el sentido de la multiplica- 


riamente se hace en el caso 


se puede 


ción en el campo Q. Puede ocurrie que algunos cocientos $} y za 
ara esto 


sean unos mismos elementos del campo Q; la condición 
es la condición ordinaria de igualdad de las fraccione: 


a TE cuando, y sólo cuando, JC) (a) =y (r) gto. 


Ho 
TO 


HE gea qe) loa, 


En electo, si a, en virtud de (1), 


de donde 
POP gpl) gor (a. 
Recíprocamente, si f (a) P (a) gto) o(r) u(x) en el sentido 


de la multiplicación en el anillo 2 Lel, pasando al campo Q obtene- 
mos las igualdades 


alo e 
EGYE PE 


úcilmente se ve luego que 
elementos de Q, qu 
representar de nuevo en forma 
además las reglas comunes de adi 


l producto de cualesquiera 

ios de P [z], se pueden 
cientes, cumplióndose 
ón y multiplicación de fracciones: 
tir) piz) Hoti sigon 


10m. 9 
TO HOLI f a 
JO 06 eret) i 
a p EOE) B 


En efecto, multiplicando ambos miembros de cada una de estas 
aldades por el producto g (2) 1 (z) y aplicando (1), obtenemos 
igualdades válidas en el anillo P [zl. La subsistencia de las igualda- 
des (2) y (3) se deduce ahora de que, debido a la ausencia de divi- 
sores de cero en el campo Q, ambos miembros de cada una de las 
igualdades obtenidas se pueden simplificar por el elemento 
g (2) y (2), diferente de cero, infringir las igualdades. 

Estas observaciones previas señalan el camino que hay que se- 
guir para construir el campo P (z). Sea dado un campo arbitrario 
P y sobre él, el anillo de los polinomios /[z1. A cada par ordenado 
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de polinomios f (z), g (z), donde g (z) + 0, ponemos en correspon- 
dencia el símbolo £2, denominado fracción racional con numerador 
1 (2) y denominador g (z). Subrayemos que esto es, simplemente, un 
símbolo que corresponde al par dado de polinomios, pues, por lo 
general, la división de los polinomios en el anillo mismo P [z] no 
es posible y, por ahora, el anillo P [z] no está contenido en ningún 
campo; incluso si g (2) fuese divisor de / (z), el nuevo símbolo Ha 


se debe distinguir por ahora del polinomio que se obtiene como 
cociente al dividir f (z) por g (z). 


i i i APIO 
Llamemos ahora iguales a las fracciones racionales HOMETOR 
1a) e) a) 


0 +m* 


umple la igualdad f (z) 9 (z) (0 ọ (2). 
er fra es igual a sí misma, y también 
al a otra, la segunda es igual a la primera. 
este concepto de igualdad se cumple la ley 
las igualdades (4) y 


si en el anillo P [z] se 
Es evidente que cualqu 
que si una fracción es ig 
Demostremos que pai 
transitiva. Sean da 


(2) 


g. o 
De las igualdades equivalentes a éstas en el anillo P |z] 
(Or, g(r) v (z) = p (r) u (2) 
se deduce que 
Hr (2) = g (2) ¢ (2) v (2) = g (2) u (2) 4 (2); 


por consiguiente, después de simplificar por el polinomio ¥ (z), 
distinto de cero (como denominador de una de las fracciones), 
resulta: 


į (x) v (x)= g (x) u (2), 


de donde, por la definición de igualdad de las fracciones, 
tia) ua) 


que es lo que se queria demostrar. 

Reunamos ahora en una clase todas las fracciones que sean 
iguales a una dada, las cuales, en virtud de la ley transitiva de la 
igualdad, serán iguales entre sí. Si en una clase hay por lo menos 
una fracción que no está contenida en otra clase, entonces, como 
se deduce de la ley transitiva de la igualdad, estas dos clases no 
tienen ningún elemento común 
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Por lo tanto, el conjunto de todas las fracciones racionales, 
escritas mediante los polinomios del anillo P |z], se descompone en 
clases disjuntas de fracciones iguales entre sí. Ahora queremos 
definir las operaciones algebraica e conjunto de clases de 
fracciones iguales, de modo que é un campo. Para esto, vamos 
a definir Jas operaciones con las fracciones racionales y vamos a com- 
probar cada vez que la sustita s (o de los factores) 
por fracciones iguales a los m también la suma (o el 
producto) por una Fracción igua mitirá hablar de la suma 
y producto de clases de fr 

Hagamos previamente | le observación que se aplicará 
a continuación: una fracción racional se convierte en una fracción 
igual, si su numerador y denominador se multiplican. por un mismo 
polinomio, diferente de cero, o si se simplifican por cualquier factor 
común. En efecto. 


ATEN 
COIN 


pues en ol anillo PL), 
HOLA = g (01/0604 (01. 
Definamos la suma de fracciones racionales por la fórmula (2); 
como g (2) 2 0 y y (2) 20, resulta que g (2) y (2) + 0, y el segundo 


miembro de esta fórmula es, evidentemente, nna fracción racional. 
Si se ha dado que 


Lw Lot, (dot 


CONT TN 


o sea, que 

Fo) gota) = g (£) fole), (o) Wo (e) <p (2) fo (2), (6) 
entonces, multiplicando ambos miembros de la primera de las 
igualdades (6) por y (2) po (z), ambos miembros de la segunda por 


g (2) go (2) y sumando después término a término estas igualdades, 
obtenemos: 


LF (o) y (£) 4- g (2) e (2)1 go (2) Yo (2) = 
Lo (£) Po (2) + go (2) o (2)1 g (2) p (2), 
lo cual es equivalente a la igualdad 
HOY t e (z) elz) _ Jol) yot) > go (r) Fotr) 
g (z) (2) Eo (7) Fo (2) 
Por lo tanto, dadas dos clases de fracciones iguales entre si, 
las sumas de cualquier fracción de una clase y cualquier fracción 
de otra clase son todas iguales entre sí, es decir, están situadas en 


una tercera clase completamente determinada. Esta clase se lama 
suma de Jas dos clases dadas. 


$ 50. Campo de fracciones racionales M7 


La conmutatividad de esta suma es consecuencia inmediata de 
(2); la asociatividad se demuestra del modo siguiente: 


Ha y 2 + (o) Hapal) y, ua o 


g (2) ++ va ¿ya TO 
LEA en + BOTON" 
g (z) (7) v (7) 
Ha eD A ea y e) 
tt 


De la definición de igualdad de fracciones se deduce fácilmente 
P 0 5 

que todas las fracciones de la forma Zq , o sea, las fracciones con el 

numerador igual a cero, son iguales entre sí y forman una clase 

completa de fracciones iguales. A ésta la llamaremos clase cero; 

demostremos que esta clase desempeña en nuestra suma el papel del 


cero, En efecto, dada una fracción arbitraria Heg se tiene 
A CEN OLIER TITO 
COTO] GOLL] TOTO 
De la igualdad 
HD a o 
IT) IT 


cuyo segundo miembro pertenece a la clase cero, se deduce ahora 
(a 


que la clase de las fracciones, iguales a la fracción ZLE, es la opuesta 


ge) 


a la clase de las fracciones que son iguales a la frac ón L2, Como ya 


sabemos, de aquí se deduce la posibilidad de la resta univoca. 
Determinemos el producto de fracciones racionales por la fór- 
mula (3). Como g (x) p (2) + 0. el segundo miembro de esta fórmula 
es, evidentemente, una frac cional. Si, luego, 
LO O l 
COI POA p’ 


o sea, 
F (2) go (2) = g (2) fo (x), (2) po (2) = Y (2) Fo (2), 
entonces, multiplicando término a término estas últimas igual- 

dades, obtenemos: 
Í (2) go (2) 9 (2) pa (2) — g (2) fo (2) y (2) Yo (2), 
lo cual es equivalente a la igualdad 


Hol — ol) polz) 
rP go (6) * 
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Por lo tanto, por analogía con la definición de la suma de las clases, 
dada anteriomente, se puede hablar del producto de clases de frac- 
ciones iguales entre sí. 

La conmutatividad y asociatividad de este producto es conse- 
cuencia directa de (3). El cumplimiento de la ley distributiva se 
demuestra del modo siguiente: 


[1D + Po] un araea «ta 


Ad dona) Ka 
INTI SI ANTE ICTICIN 
Do (a) Pa 
LUN ta) u (a) v (e) ie (a) p (a) u (r) v (r) f (a) u (x) | o (2) u (z) 
Š E (2) (a) v? (e) INTO E TO I 


LD (0 y 010 alo 

a(z) v(2) p(s) v (z) 
cilmente se observa que las fracciones de la forma HË), o sen, 
las fracciones cuyos numeradores son iguales a sus denominador 
son iguales entre sí y forn adividual. Esta se lam 
clase unidad y en nuestra multiplicación desempeña el papel de la 
unidad: 


1) g) _ 100 z) 4) 
HE) y ( For ya)” 
Si, finalmente, la fracción pa no pertenece a la clase cero, 
o sea, f(2) 40, existe la fracción HB, Como 


L gle) _ [ela 


ra E eE 
y el segundo miembro de esta igualdad pertenece a la clase unidad, 


la clase de las fracciones, iguales a la fracción £%, será repíproca 
1) 
a la clase de las fracciones, iguales a la fracción w, De aquí se 


deduce que es posible la división unívoca. 

Por lo tanto, en virtud de las definiciones anteriores de las opera- 
ciones, las clases de fracciones racionales, iguales entre sí, con coefi- 
cientes del campo P, forman un campo conmutativo. Este es el campo 
buscado P (z). Por cierto, todavía tenemos que demostrar que en el 
campo construido está contenido un subanillo, isomorfo al anillo 
P xl, y que cada elemento del campo se representa en forma de un 
cociente de dos elementos de este subanillo. 

Si a un polinomio arbitrario f (z) del anillo P |z} ponemos en 
correspondencia la clase de fracciones racionales, iguales a la frac- 
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ción H (naturalmente, entre éstas también están contenidas las 
fracciones cuyos denominadores son iguales a la unidad), obtenemos 
una aplicación biyectiva del anillo P [x] en el interior del campo que 
hemos construido. En efecto, de la igualdad 
Haea 
1 € 

resultaría f (2)-1=1-p (2), o sea, f (z) =q (z). Como muestran las 
igualdades 


La (0 _ Jia 
+5 7 = 
MENTOR ISNIE] 
1 aai $ 
esta aplicación es incluso un isomorfismo. 


Por lo tanto, las clases de fracciones, iguales a las fracciones de la 
La) 


forma H® , forman en nuestro campo un subanillo que es isomorfo al 


La 


anillo P |x). Por esto, la fracción se puede designar simplemente 


mediante f (z). Finalmente, como e ones dias tniccions igual 


a la Fracción o g(z)> 


di O, es reciproca a la clase de 
g(a) 
las fracciones, iguales a la fracción £2, de la igualdad 


se deduce que todos los elementos de nuestro campo se pueden considerar 
(en el sentido de las operaciones definidas en este campo) como 
cocientes de polinomios del anillo P |z). 

De este modo, hemos construido el campo de fracciones racion 
les P (x) sobre un campo arbitrario P. Tomando el anillo de los 
números enteros, en lugar del anillo de los polinomios, se puede cons- 
truir de este mismo modo el campo de los números racionales. Agru- 
pando estos dos casos y aplicando un método igual, se podría demos- 
trar el teorema de que, en general, cualquier anillo conmutativo 
sin divisores de cero es un subanillo de algún campo. 


CAPITULO XI 


POLINOMIOS 
EN VARIAS INDETERMINADAS 


51. Anillo de los polinomios en varias indeterminadas 


A veces se suelen considerar polinomios que no dependen de una, 
sino de dos, tres, y en general, de varias indeterminadas. Así, en 
los primeros capítulos del libro se estudiaron las formas lineales 
y cuadráticas, que representan ejemplos de estos polinomios. En 
general, se llama polinomio f (x, „) en n indeterminadas 
Tis Za, + ++ 2n Sobre un campo P, a la suma de un número finito de 
iérminos de Ja forma ýt z}! .. . ztn, donde k; >0, con coefi 
tes del campo P; se supone que el polinomio f (21, Za, +. - 
no contiene términos semejantes y que se consideran solamente 
términos con coeficientes diferentes de cero. Dos polinomios en n 
indotorminadas, f (ti, La. +... Zn) Y £(%, T: Zn), se consi- 
deran iguales (o idénticamente iguales), si son iguales sus coeficientes 
de potencias iguales. 

Dado un polinomio f (21. £s » 
llama grado con respecto a la indeterminada xi, i = 1, 2, ... n, 
al exponente máximo con que figura z; en los términos de este poli- 
nomio. Puede ocurrir eventualmente que este grado sea igual 0, lo 
cual significa que a pesar de que f se considere como polinomio 
en n indeterminadas Ti, Ze, +. .+ Zis > «<> Zps €n realidad, la inde- 
terminada z; no figura en su expresión. 

Por otra parte, si llamamos grado del término 


2.) sobre un campo P, se 


sa 
q. ra 


«= ~> kn, o sea, a la suma de los exponentes 
de las indeterminadas, el grado del polinomio f (zy, Za, ..-, £n) 
(o sea, el grado respecto del eonjunto de las indeterminadas) será el 
grado superior de sus términos. En particular, al igual que en el 
caso de una indoterminada, son polinomios de grado cero solamente 
los elementos del campo P, diferentes de cero. Por otra parte, del 
mismo modo que en el caso de los polinomios en una indeterminada, 
el cero es el único polinomio en z indeterminadas cuyo grado está 
indefinido. Claro, en el caso general, un polinomio puede contener 


al número k; + ko 
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unos cuantos términos de grado superior, por lo cual, no se puede 
hablar de un término superior (según el grado) del polinomio. 

Para los polinomios en z indeterminadas sobre un campo P, 
las operaciones de sumar y multiplici 

Se llama suma de los polinomios f(%;, £o .-., Zn) y 
B (Zi Z2, » » -» 2a) al polinomio cuyos coeficientes se obtienen 
sumando los coeficientes correspondientes de los polinomios f y g; 
naturalmente, si en este caso algún término figura solamente en uno 
de los polinomios f, g, el coeficiente de éste en el otro polinomio 
se supone igual a cero. El producto de dos «monomios» se define 
por la igualdad: 


A aP = (ab) aii atea,,, gintn 


después de lo cual, el producto de los polinomios f (z1, Ze, +. -, Zn) 
yg (či, Zo, > ., 2,) se define como el resultado de la multiplicación 
término a término y la consiguiente reducción de términos semejantos. 

Definidas las operaciones de este modo, el conjunto de los polinomios 
en n indeterminadas sobre el campo P se convierte en un anillo conmu- 
tativo que, además, carece de divisores de cero. En electo, para n 
nuestras definiciones coinciden con las que se dieron en el $20 para 
el caso de polinomios en una indeterminada. Supongamos que so ha 
demostrado que los polinomios en n — 1 indeterminadas 21, £s, ++. 
n-ı Con coeficientes del campo P forman un anillo sin divi- 
sores de cero. Todo polinomio en z indeterminadas z, EAS 
£a so puede representar de un modo único como un polinomio en la 
indeterminada z, con coeficientes que son polinomios en Ty, La, +. + 
sees n-i} recíprocamente, todo polinomio en z, con coeficientes 
del anillo de los polinomios en zi, zs, .. ., a-i Sobre el campo P 
se puede considerar, naturalmente, como un polinomio sobre el 
mismo campo P en todo el conjunto de las indeterminadas 24, tay... 
aas Eats Zn, Se comprueba sin dificultad que la correspondene 
biunívoca, obtenida entre los polinomios en z indeterminadas y los 
polinomios en una indeterminada sobre el anillo de los polinomios 
en m —1 indeterminada s un isomorfismo con respecto a las 
operaciones de sumar y multiplicar. La proposición que se demuestra 
se deduce de que los polinomios en una indeterminada sobre el 
anillo de los polinomios en n — 1 indeterminadas forman ellos 
mismos un anillo que, además, por ser un anillo de polinomios en una 
indeterminada sobre un anillo sin divisores de cero, tampoco contiene 
divisores de cero (véase $47). 

Por consiguiente, queda demostrada la existencia del anillo 
de los polinomios en n indeterminada sobre el campo P; este anillo 
se designa con la notación P {z}, 22, ..., £pl. 

El estudio siguiente permite examinar el anillo de los polinomios 
en n indeterminadas desde otro punto de vista. Supongamos que el 
21—252 
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campo P está contenido como subanillo en un anillo conmutativo L 
Tomemos en L n elementos %;, a. 2, y hallemos el subanillo- 
mínimo £* del anillo Z que contiene a estos elementos y a todo el 
campo P, o sea, el subanillo que se obtiene por adjunción de los 
elementos &i, a, - - =» €n al campo P. El subanillo £’ consta de 
todos los elementos del anillo Z que se expresan mediante los ele- 
mentos %1, 2, - - => Un y los elementos del campo P aplicando la 
suma, resta y multiplicación. Fácilmente se observa que éstos son 
exactamente los elementos del anillo Z que se pueden expresar 
(aplicando las operaciones que subsisten en el anillo L) en forma de 
polinomios en %1, %o, - - -, %, con coeficientes de P; además, estos 
elementos, como elementos del anillo L, se pueden sumar y multi- 
plicar precisamente según las leyes de adición y multiplicación 
de los polinomios en z indeterminadas. 

Claro, por lo general, un elemento dado f del subanillo Z” puede 
poseer muchas expresiones distintas en forma de polinomio en 
is Am >» -, %, con coeficientes del campo P. Si esta expresión es 
única para cualquier $ de Z’, es decir, que diferentes polinomios en 
y oy » -s An son elementos distintos del anillo Z” (y, por con- 
siguiente, del anillo Z), el sistema de elementos %j, o, . .-, Cn 
se llama algebraicamente independiente sobre el campo P. En caso 
contrario, se llama algebraicamente dependiente*. De aquí, se puede 
hacer la siguiente conclusión 

Si un campo P es un subanillo de un anillo conmutativo L y si el 
sistema de elementos 1, 3, . . .. tn de L es algebraicamente indepen- 
diente sobre P, el subanillo L’ del anillo L, engendrado por adjunción 
de los elementos œ, %a, » » <» Un al campo P, es isomorjo al anillo 
de los polinomios Plx;, tz, ..-., Enl- 

Entre otras propiedades del anillo de los polinomios en n indeter- 
minadas P [z,, Za, » . ., 2,), señalemos la jente: este anillo se 
puede incluir en el campo de fracciones racionales P (21, £2, . . -, 25) 
en n indeterminadas sobre el campo P. Todo elemento de este campo 


so puede expresar en la forma -Ż, donde f y g son polinomios del 


anillo P lx, 22, «.. Zal, siendo, además, L=-L cuando, y sólo 
cuando, fọ = gq. La suma y el producto de estas fracciones racio- 
nales se efectúan según las leyes que, como se indicó en el $ 45, se 
cumplen para los cocientes en cualquier campo. La demostración 
de la existencia del campo P (21, 22, - --, £n) se hace igual que 
en el $ 50 para el caso n = 1. 


* Los conceptos correspondientes para el caso n = 1 fueron introducidos. 
en el $ 47; un elemento æ, algebraicamente independiente sobre el campo P, 
en el sentido de la definición que se acaba de dar, se llamaba entonces trascen- 
dente sobre P; en el caso contrario, algebraico sobre P. 
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Para los polinomios en varias indeterminadas se puede construir la teoría 
de la divisibilidad que generaliza a la teoría de la divisibilidad de los polino- 
mios en una indeterminada, estudiada en los cap. 5 y 10. Mas, como no entra en 
muestro plan el estudio detallado del anillo de los polinomios en varias inde- 
terminadas, nos limitaremos solamente a la cuestión de la descomposición de 
un polinomio en factores irreducibles. 

Introduzcamos primero el siguiente concepto: si todos los términos de un 
polinomio f (Z, 22. ;;», Zn) son de un mismo grado s, éste se llama polinomio 
homogéneo o, abreviadamento, forma de grado s (ya conocemos las formas linea- 
les y cuadráticas, se pueden considerar luego las formas cúbicas, todos los térmi- 
nos de las cuales son de grado 3 con respecto del conjunto de las indeterminadas, 
ete). Todo polinomio en » indeterminadas se representa unívocamente en 


además, de distinto grado: para 
agrupar todos los términos de un 
grado f (£1, Ta, 23) = 32: 
do la forma de cuarto grado z} — 7. 
L a}, de la forma lineal zs — 2r, y del término independiente — 
grado coro). 

Demostremos ahora el siguiente teorema; 
l grado del producto de dos polinomios en n indeterminadas, diferentes 
de cero, es igual a la suma de los grados de estos polinomios. 

¡pongamos primero que se dan dos formas: q Èri, zs, «<=» 7n) de grado s 

y t: zn) de grado t. El producto de cualquier término de la forma y 
por cualquier término de la forma ip es, evidentemente, de grado s + £ y, por 
esto, el producto xp será uma forma de grad £, pues, el producto de termi 
mos semejantes no puede anular a todos lo icientes de este producto, y 
de en el anillo P (zi, x2, 0, zn} no hay divisores do cero. 
se dan ahora unos polinomios arbitrarios (21, Ze, ..., Tn) Y g (an 22 
x.. 2) de grado s y £, respectivamente, representando cada uno de ellos en forma 
dle ula suma de formas de grados distintos, obtenemos: 


J (Z1 Zas ++ Ta) la 
B (Ei Zos e In) =p (Ti as 


donde q y son formas de grado s y £, respectivas 
sustituyen a las sumas do las formas de grado menor 


tea +-- 


por lo demostrado, la forma q es do grado s 4 £, y como todos los términos 
Auidos por puntos suspensivos tienen menor grado, el grado del producto 
igual a s4- t. El teorema queda demostrado. 
1 polinomio q se Mama divisor del pol y J es divisible po 
el anillo P (xy. 22, <> xn | oxiste un poli . que f = qp. 
se observa que las propiedades de divisi del $ 21 so conservan tam- 
bién en el caso general que ahora est Se dice que un polinomio f de 
grado k, k >> 1, es reducible sobre un campo P, si se descompone en un producto 
de polinomios del anillo P [z,, 22, ».-, zn ), de grados menores que k, e irreduci- 
ble, en caso contrario. 

Tordo polinomio del anillo P |z, z znl, de grado distinto de cero, se des- 
compone en un producto de factores irreducibles. Esta descomposición es única, 
salvo factores de grado cero. 
ste teorema generaliza los resultados correlativos del $ 48, referentes 
a los polinomios en una indeterminada. Su primera tesis se demmestra 
repitiendo palabra por palabra los razonamientos del párrafo indicado. La 
demostración de la segunda tesis presonta ya dificultades considerables. Antes 


a. 


` 


puntos suspensivos 
tone 
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de exponerla, observemos que de la segunda tesis se deduce este corolario: 
si el producto de dos polinomios, f y g, del anillo P [z4 23, -.., xq), es divisible 
por un polinomio irreducible p, al menos uno de estos polinomios es divisible 
por p. En efecto, en caso contrario obtendríamos para el producto fg dos des- 
composiciones en factores irreducibles, una de las cuales no contendría a p, 
mientras que la otra le contendría. 

Supongamos que el teorema ya está demostrado para los polinomios en n 
indeterminadas y queremos demostrarlo para los polinomios en n + 4 indeter- 
minadas, 2, z1, Ta, -»., Zn. Escribamos este polinomio en la forma q (z); por 
consiguiente, sus coelicientes serán polinomios en Zi, 72, ..., 3y. Para estos coe- 
Ticientes ol teorema ya está demostrado, es decir, cada uno de ellos se descompo- 
ne univocamente en un producto de factores irreducibles, Llamemos primitivo 
(más exacto, primitivo sobre el anillo P [2;, zz, ..., xp!) al polinomio q (2), 
si sus coeficientes no contienen ningún factor común irreducible, o sea, si éstos 
son primos entro sí, y demostremos el siguiente lema de Gauss: 

El producto de dos polinomios primitivos también es un polinomio primitivo. 

En efecto, sean dados los polinomios primitivos 


MO iaat nnn 


yla) = boz! by 


con coeficientes del anillo P [zp z3, +..+ 3n] y sea 
P(E) e (a) = cozttt i egt tit cp jahti- u i engt 


Si este producto no es primitivo, los coeficientes co, cs, s., cays tienen que 
poscor un factor común irreducible p = p (21, z2, ..., Zn). Como no todos los 
coeficientes dol polinomio primitivo f (x) son divisibles por p, supongamos 
que a, es el primer coeficiente que no es d le por p; análogamente, desig- 
namos con by ol primor coeficiente del polinomio g (z) que no es divisible por p. 
Multiplicando término a término los polinomios f (z) y g (z) y agrupando los 
términos que contienen a z*+=«+4, obtenemos: 


0144040 GH abya ta jr 


El primer miembro de esta igualdad es di 
bio p. Sin duda, son divisibles por éste también todos los términos del segundo 
miembro, menos el primero; en efecto, en virtud de las condiciones impuestas 
a la elección de ¿ y j, todos los coeficientes arı, 21.3, --., y también bj- 
b; ., son divisibles por p. De esto se deduce que el producto 2,0, también 
es divisible por p y, por esto, como se indicó anteriormente, tiene que ser 
divisible por p al menos uno de los polinomios ay, by, lo cual, sin embargo, no 
tiene lugar. Con esto so termina la demostración del lema, suponiendo que el 
teorema fundamental se verifica para los polinomios en n indeteriminadas, 

Como ya sabemos, el anillo P {z1 23, -. +» Za ] stá contenido en ol campo de 
fracciones racionales P (24, 22, - .-, z4) que designaremos con Q: 


Q=P (24 10 Tn) 


Oda rajar 


ible por el polinomio irreduci- 


Consideremos el anillo de los polinomios Q [z]. Si un polinomio y (z) per- 
tenece a este anillo, cada uno de sus coeficientes se representa en forma de un 
cociente de polinomios del anillo P [z;, zz, ..., zn ). Sacando fuera de paréntesis 
el común denominador de estos cocientes, y después, los factores comunes de los 
numeradores, se puede representar ¢ (z) en la forma 


e =F. 
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Aquí, a y b son polinomios del anillo P [z;, z2, ..., za] y f(x) es un polinomio 
en z con coeficientes de P [zy, z2, .. .. Zn], que es además primitivo, pues sus 
coeficientes ya no tienen factores comunes. 

De este modo, a cada polinomio q (z) del anillo Q [z] se pone en correspon- 
dencia un polinomio primitivo j (z). Dado y (z), el polinomio f (x) queda deter- 
minado univocamente, salvo un factor de P distinto de cero. En efecto, supon- 
gamos que 


90-7(0=7 (0 
donde g (z) es de nuevo un polinomio primitivo. Entonces, 
adf (2) =bog (2). 

Por lo tanto, ad y be so han obtenido sacando todos los factores comunes de los 
coeficientes de un mismo polinomio sobre el anillo P [z, z2, - . ., xn]. Como en 
este anillo subsisto (por la hipótesis de inducción) el teorema de unicidad 
de la descomposición, de esto se deduco que ad y be pueden diferenciarse entre 
sí solamente en un factor de grado coro. Por consiguiente, los polinomios pri- 
mitivos f (z) y g (x) se diferencian entre sí en este mismo factor. 

Al producto de dos polinomios del anillo Q [z] le corresponde el producto de 
los polinomios primitivos correspondientes. En efecto, si 


VOD n= Gel 


donde f (z) y g (z) son polinomios primitivos, resulta 


PONG (a. 


Poro, como se ha demostrado m 
primitivo, 

Señalemos también que, si el polinomio y (x) del anillo Q [x] es irreduci- 
hle sobre el campo Q, su polinomio primitivo correspondiente } (x), considerado 
como un polinomio en x, 21, 22, .-., zn, también será irreducible, y viceversa, 
En efecto, si el polinomio f es reducible, 7 = fifa, ambos factores tienen que 
contener la indeterminada z, pues, en caso contrario, el polinomio f no sería 
o De aquí resulta la descomposición del polinomio q (z) sobre el 
campo Q: 


arriba, el producto f (z) g (z) es un polinomio 


A (FA) te 


Recíprocamente, si el polinomio q (z) es reducible sobre Q, Y (z) = pı (2) 
q (2), los polinomios primitivos fı (z) y fa (z) correspondientes a qu (2) y qa (2) 
contendrán z, pero como se demostró antes, su producto es igual a } (z) (salvo 
un factor del campo P). 

Tomemos ahora un polinomio primitivo f y descompongámoslo en factores 
irroducibles, f-=f1-f2 - .. fa. Todos estos factores no sólo tienen quo contener 
a la indeterminada z, sino que tienen que ser incluso polinomios primitivos, 
pues, en caso contrario, el polinomio f no sería primitivo. Esta descomposición 
del polinomio primitivo f es única salvo factores del campo P. En efecto, en vir- 
tud del lema precedente, se puede considerar esta descomposición como la des- 
composición de f (z) en factores irreducibles sobre el campo Q; mas, para los 
polinomios en una indeterminada sobre un campo dado, ya es conocida la uni- 
cidad de la descomposición que so verifica, salvo factores de Q; pero, en nues- 
tro caso, como todos los factores fi son primitivos, ésta se verifica, salvo facto- 
res de P. 
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D 


partiendo de la hipótesis de 
inducción, se hace 


in dificultad alguna ostración de nuestro teore- 

ma fundamental, o polinomio irreducible del anillo P [z, zy. 

Zn), © es un polinomio irreducible del anillo P [z;, ze.» +, 2n J, © €S un 

mitivo irreducible. De aquí se deduce que, dada una descomposi- 

ción del polinomio y (z, 21, Za, - . -» 2,) en factores irreducibles, agrupando los 
factores se puede representar q en la forma 


P(E, Zp Fg ES tTn) f(n Pi 


2 nde 


dondo a no depende de z y f es un polinomio pri 
mos que esta descomposición de ¢ es única, salvo factores de JP. Pero, por otra 
parto, como, por la hipótosis de inducción, subsiste la unicidad de la descompo- 
sición en factores irreducibles para el polinomio a en n indeterminadas, y como 
esta unicidad está demostrada en el lema anterior para el polinomio primitivo f. 
queda también complotamente domostrado nuestro teorema para el caso de 
n41 indeterminadas. 

Do los lemas demostrados anteriormento se deduce un corolario interesante: 
si un polinomio y (z) con coeficientes de Plz, Z3. «+ 3n) es reducible sobre el 
campo Q = P (z1, zz, =0. Zn), entonces se puede descomponer en factores que 
dependen de x y cuyos coeficientes son polinomios del anillo Plz, zo. ta). 
En electo, si al polinomio q (z) le corresponde el polinomio primitivo f (2), de 
modo que q (2):=0f (2), entonces la descomposición de (z) implica h 
descomposición de f (1); poro esto último implica a su vez la descomposi 
de q (2) sobre ol anillo P fz, z2. m). 

A diferencia del caso de los polinomios en una indeterminada que, como ya 
sabemos por ol $ 49, se pueden descomponer en factores lineales sobre una amplia- 
ción adecuadamente elegida del campo fundamental considerado, existen 
sobre cualquier campo P polinomios de cualquier grado en varias (dos o más) 
indeterminadas que son absolutamente irreducibles, o sen, polinomios que e 
mantienen irreducibles sobre cualquier ampliación de esto campo. 

Do este tipo es el polinomio 


Ma no) 


donde q (z) es un polinomio arbitrario en una indeterminada sobre un campo P. 
En efecto, si en cierta ampliación P del campo P existiese la descomposición 


Sin embargo, ya sabe- 


dies Ny yr y. 
entonces, expresando g y h según las potencias de y, obtendríamos, por ejemplo, 
gls y) =00(2) y+ as (2), A(z, y)= bo (2), 


o sea, » no dependería de y; y como aolz)bo(z) = 1, resultaría que bp (x) sería 
do grado cero y, por lo tanto, A no dependería tampoco de z. 


Ordenación Jexicográfica de los términos de un polinomio. Para 
los polinomios en una indeterminada se tienen dos métodos natu- 
rales de ordenación de los términos: según las potencias decrecientes 
de la indeterminada y según las potencias crecientes de la misma. 
En el caso de polinomios en varias indeterminadas, tales métodos 
no existen; por ejemplo, el polinomio de quinto grado en tres inde- 
terminadas 


2 e at a, 
Í (Ei a 2) = 240323 A TaT 
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eribirse también en la forma 
(lr Tp 2) ajo dad maja ada, 


sin que haya ningún motivo para dar preferencia a una de estas 
expresiones ante la otra. Pero existe, sin embargo, un método com- 
pletamente determinado de ordenación de los términos de un polino- 
mio en varias indeterminadas que depende, por cierto, de la numera- 
ción elegida de las indeterminadas; para los polinomios en una inde- 
terminada, este método se reduce a la ordenación de los términos 
según las potencias decrecientes de la indeterminada. Este método, 
denominado lezicográfico, está dictado por el procedimiento común 
de ordenación de las palabras en los diccionarios («vocabularios»): 
suponiendo que las letras están ordenadas como está convenido en el 
alfabeto, la posición relativa en el diccionario de dos palabras dadas 
se determina por sus primeras letras; si éstas coinciden, por sus 
segundas letras, etc. 

Sea dado m polinomio f/ (2 fe .. 
£,1 y dos términos distintos de él: 


puedo 


i) del anillo 


(Sie dar + 


a) 
a) 


enyos coeficientes son elementos de P, diferentes de cero. Como 
los términos (1) y (2) son distintos. s una de las diferencias 


¡2 


es diferente de cero. El término (1) se considerará super 
mino (2) (y el término (2), inferior al término (1), si la primera de 
estas diferencias, distinta de cero, es posi si existo una i, 
1 n, tal que 


4= bo ka- 


En otras palabras, el término (1) será superior al tórmino (2), si el 
exponente de z; en (1) es mayor que en (2) o, siendo estos exponentes 
iguales, si el exponente de za en (1) es mayor que en (2), ete. Por 
supuesto, el hecho de que el término (1) sea superior al término (2) 
no implica que el grado del primero con respecto al conjunto de las 
indeterminadas sea mayor que el del segundo. Por ejemplo, el pri 
mero de los términos 


«r kia =d4- 44 pero ki> ho. 


E 


es superior al segundo, a pesar de que es de menor grado. 
Es evidente que, de dos términos distintos de un polinomio 
$ (čis Zas «e Zn), uno de ellos es superior al otro. Fácilmente se 
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comprueba también que, si el término (1) es superior al término (2), 
y éste, a su vez, es superior al término 


a. a, © 
o sea, que existe una j, 1<j<n, tal, que 
l= mp la=ma, -s Lea my- pero Ly Mp 


cl término (1) es superior al término (3), independiente de que sea È 
mayor, igual o menor que j. Por lo tanto, de cada dos términos, 
poniendo delante el que sea superior, obtenemos una ordenación 
determinada de los términos del polinomio f (zi, Za +++, Zn) 
Mamada lexicográfica. 

Así, pues, la ordenación de los términos en el polinomio 


Í (Ei Zas Ey, 24) = zi + Brit ta — ajaja; de Strat -i 2x9 dr — 4 


es lexicográfica. 

En la expresión lexicográfica de un polinomio f (t1, Ze, ++, £n)» 
uno de sus términos ocupará el primer lugar, o sea, será superior 
a todos los demás. Este se llama término superior del polinomio; en el 
ejemplo precedente, el término superior es z$. Respecto a los tórmi- 
nos superiores, demostraremos un lema que se aplicará en la demos- 
tración del teorema fundamental del siguiente párrafo: 

El término superior del producto de dos polinomios en n indetermi- 
nadas es igual al producto de los términos superiores de los factores. 

En efecto, supongamos que se multiplican los polinomios 
Í (Eis Zar -ar En) Y E (Ti Tos >> ++ Zn). Si 


atar... (4) 
A 
es el término superior del polinomio f(*%;, £z, ..., za) Y 
aaa ae 5) 


es otro término cualquiera del mismo, existe un valor i, 1<i<n, 
tal que 


k 
Si, por obra parto, 


Sr. Ara = Si- KD St 


© 
(g) 


son el término superior y otro término cualquiera del polinomio 
g(Zi Za --., Zn), existe un valor j, 1<j<n, tal que 


ETO la 


tro G>ti 
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Multiplicando los términos (4) y (6 
y (7), obtenemos 


, y también los términos (5) 


abai" dahri ainia, (8) 
att, nt, (9) 


Sin embargo, fácilmente se comprueba que el término (S) es superior 
al término (9); si, por ejemplo, ¿< j, resulta, 


s kiat li = Sia lin pero kith > sit las 


pues ki >s, >t. Del mi 


k+hss 


mo modo se comprueba que el tér- 
to de los términos (4) y (7), y superior 


quo es el producto de los términos superiores de los polinomios f y g, 
es superior a todos los demás términos que se obtienen multiplicando 
término a término los polinomios f y g, y, por lo tanto, este término 
no puede eliminarse al reducir los términos semejantes, © sea, se 
mantiene en el producto fg como término superior. 
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Entre los polinomios en var determinadas se distinguen los 
que no varían con cualquier permutación de las indeterminadas 
Por consiguiente, en tales polinomios figuran todas las indetermi- 
nadas de un modo simétrico, por lo cual se llaman polinomios simé- 
tricos (o funciones simétricas). Los ejemplos más elementales son: 
la suma de todas las indeterm das xy +... + Za la suma 
de los cuadrados de las indeterminadas xi + z3- ... + zh el 
producto de las indeterminadas 2,72... zp, etc. En virtud de la 
posibilidad de expresar cualquier sustitución de n símbolos en forma 
de un producto de trasposiciones (véase el $ 3), para demostrar que 
un polinomio es simétrico, es suficiente comprobar que éste no varía 
al efectuar una trasposición cualquiera de dos indeterminadas. 

A continuación se estudiarán los polinomios simétricos en n 
indeterminadas con coeficientes de un campo P. Está claro que la 
suma, diferencia y producto de dos polinomios simétricos son también 
simétricos, es decir, los polinomios simétricos forman un subanillo 
en el anillo P Lei, z2, - - - 7.) de todos los polinomios en n inde- 
terminadas sobre el campo P, denominado anillo de los polinomios 
simétricos en n indeterminadas sobre el campo P. Todos los elementos 
del campo P pertenecen a este anillo (o sea, todos los polinomios 
de grado cero, y también el cero), ya que éstos no varían al efectuar 
cualquier permutación de las indeterminadas. Cualquier otro pol 
nomio simétrico contiene indispensablemente todas las z indetermi- 
nadas, e incluso con respecto a ellas tiene un mismo grado. En efecto, 
si el polinomio simétrico f (ti, Za, - - ., Zn) tiene un término en el 
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que la indeterminada z; figura con el exponente +, entonces tiene 
también el término que se obtiene de este último mediante la traspo- 
sición de las indeterminadas z; y zj, o sea, el que contiene a la 
indeterminada z; con el mismo exponente k. 

Los n polinomios simétricos en n indeterminadas que se exponen 
a continuación se llaman polinomios simétricos elementales: 


Ori Ey -H Ea- + E Zo 


Tyta io etat -o e i En-a 


O3 = 2y gt5-}- Eytt, E - Za 
Ty l- Td + u) 

CAE ARE E E EE a ba 

Op = Zita 2... Tao j 


Estos polinomios que, evidentemente, son simétricos, desempeñan un 
papel muy importante en la teoría de los polinomios simétricos. 
Su origen se debe a las fórmulas de Vieta (véase el $ 24). Por esto, 
se puede decir que los coeficientes de un polinomio en una indeterminada, 
cuyo coeficiente superior es igual a la unidad, son, salvo el signo, los 
polinomios simétricos elementales en sus raíces. Esta relación de los 
polinomios simótricos elementales con las fórmulas de Vieta es muy 
importante para las aplicaciones de los polinomios simétricos a la 
teoría de los polinomios en una indeterminada, y es la causa por la 
que ahora los estudiamos. 

Como los polinomios simétricos en n indoterminadas zy, da, +... 
+ + «y Ey sobre el campo P forman un anillo, resultan evidentes las 
proposiciones siguientes: es un polinomio simétrico cualquier potencia 
entera y positiva de cualquiera de los polinomios elementales simé- 
bricos, y también el producto de tales potencias, tomado además 
con cualquier coeficiente de P y, finalmente, cualquier suma de los 
productos indicados. En otras palabras, cualquier polinomio 
polinomios simétricos elementales Or, Os, -. +, Gps 
«de P, considerado como un polinomio en las indeterminadas tı, £z, . 
«e Tp, es simétrico. Así, pues, pongamos n = 3 y tomemos el pol 
nomio 0,0, + 207. Sustituyendo 0,, Os y 03 por sus expresiones, 
obtenemos: 

9107 -+ 20; 
«evidentemente, en el segundo miembro figura un polinomio simé- 
trico en Ti, Za Za 

Recíproco a este resultado es el siguiente teorema fundamental 
«de los polinomios simétricos: 

Todo polinomio simétrico en las indeterminadas tı, Tay .. ., En 
sobre el campo P es un polinomio en los polinomios simétricos elemen- 
tales 01, O», . . ., 0, con coeficientes pertenecientes al campo P. 


A A rart t Saya: 
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En efecto, sea dado un polinomio simétrico 
Í lEn Tas ->-> 2n) 


y supongamos que en su expresión lexicográfica el término superior es 


arar. a (2) 


Los exponentes de las indeterminadas en este término tienen que 
satisfacer a las desigualdades 


ki>kr> -> kn (€) 


En efecto, supongamos que para cierta i, k< kis El polinomio 
Í (Zn tas -->, Zn), siendo simétrico, tiene que contener el término 


(4) 


que se obtiene del término (2) mediante una trasposición de las 
indetorminadas z; y 2,41. Sin embargo, esto es absurdo, puesto que 
el término (4), en el sentido de la ordenación lexicográfica, es supe- 
rior al término (2); en efecto, los exponentes de Ti, £o, -n Sizi 
en ambos términos coinciden, pero el exponente de z; en el Lérm 
no (4) es mayor que en el término (2). 

Consideremos ahora el siguiente producto de polinomios elemen- 
tales simótricos (en virtud de las desigualdades (3), todos los expo- 
nentes son no negativos): 

A Magia: ha 


ka (5) 


Este polinomio en las indeterminadas zi, z», -- ., 2, es simótrico 
y su término superior es igua o (2). En efecto, los términos 
superiores de los polinomios i, Oz, Os -.+., 0, Son iguales a 
Ei, Bza, BiZa + 0 y Zi Lo > > Zar respectivamente, y como al 
final del párrafo anterior se demostró que el término superior del 
producto es igual al producto de los términos superiores de los 
factores, el término superior del polinomio q, es 


aha 


in- 
P= a0} mat 


aori"? O (axara) 


A O E a a a 


De aquí se deduce que, al restar q, de f, los términos superiores 
de estos polinomios se èliminan entre sí, o sea, el término superior 
del polinomio simétrico / —{, — fı resulta menor que el término (2), 
que es el superior en el polinomio f. Repitiendo esle mismo procedi- 
miento para el polinomio f,, cuyos coeficientes pertenecen evidente- 
mente al campo P, llegamos a la igualdad 


h=tr+ fz 
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donde q» es un producto de potencias de polinomios simétricos ele- 
mentales con cierto coeficiente del campo P, y fa, un polinomio 
simétrico cuyo término superior es inferior al término superior de fi. 
De aquí, resulta la igualdad 
1= + oat fa 

Continuando este proceso, para cierto s obtenemos f, = 0. De 
este modo, llegaremos a obtener para f una expresión en forma de un 
polinomio en 01, Os, . . ., O, con coeficientes de P: 

Í (Es, Zas 0, 20) = D P= P (01) 02, -+ -> On). 


En efecto, si este proceso fuese indefinido*, obtendríamos una 
sucesión indefinida de polinomios simétricos 


Ío Ín cado e (6) 


donde el término superior de cada uno de ellos sería inferior a los 
términos superiores de los precedentes polinomios y, por lo tanto, 
inferior a (2). Pero, si 


tata... ale Mm 


es el término superior del polinomio f,, como este último es simé- 
trico, resultan las desigualdades 


L>La>..->la (8) 


somejantes a las desigualdades (3). Por otra parte, como el térmi- 
no (2) es superior al término (7), se tiene 


ki> ho (9) 


Además, se observa fácilmente que los sistemas de números enteros. 
no negativos di, day ..., ln, que satisfacen a las desigualdades (8) 
y (9), se pueden elegir solamente de un número finito de modos. En 
efecto, incluso cuando no se insiste en el cumplimiento de la condi- 
ción (8), si se supone solamente que todas las ,, i= 1, 2, .. ., m, 
no son mayores que k;, resulta ya que los números 1, se pueden elegir 
solamente de (%, + 1)" modos. De aquí se deduce que la sucesión 
de polinomios (6) con los términos superiores estrictamente decre- 
cientes, no puede ser indefinida. 

El teorema queda demostrado. 

De la relación entre los polinomios elementales simétricos y las 
fórmulas de Vieta, indicadas anteriormente, se desprende el siguiente 
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corolario importante del teorema fundamental de los polinomios 
simétricos: 

Sea f (x) un polinomio en una indeterminada sobre el campo P, con 
el coeficiente superior igual a la unidad. Entonces, cualquier polinomio 
simétrico (con coeficientes de P) en las raíces del polinomio f (z), per- 
tenecientes a un campo de descomposición del polinomio f (z) sobre P, es 
un polinomio (con coeficientes de P) en los coeficientes del polinomio 
1 (2) y, por lo tanto, es un elemento del campo P. 


La demostración expuesta del teorema fundamental proporciona a la vez 
un método para la averiguación práctica de las expresiones de los polinomios 
simétricos mediante los polinomios elementales. Hagamos primoro la siguiente 
notació iendo 


aziak? aan (10) 


un producto de potencias de las indetermin 
exponentes pueden ser iguales a cero), medi 


Sixties... zm an 


xn (algunos de los 


dosignaromos la suma de todos los términos que se obtienen de (10) al permutar 
las indoterminadas de todos los modos posibles. Evidentemente, éste es un poli- 
nomio simétrico y homogéneo. También es evidente que cualquier polinomio 
¡métrico on n indoterminadas que contenga al término (10), contiene también 
todos los demás términos del polinomio (11). Por ejemplo, S (z) 
S (2,22) = 02, S (23) es la suma de los cuadrados de todas las indeterminad 
Ejemplo. Expresar el polinomio simétrico / = S(xjz3) en n indeterminadas 
mediante los polinomios simétricos elementales, 
Aquí, el término superior es xjz, y por esto, fi = 07102 


+ Znin) = 
3S (xizar;) 


102, 0 sen, 


A zg += Zn) (T4 Lg) 2439 


de donde 
h- 1-4 


Por esto f =p- f = 0103 —303. 

En ejemplos más complicados es conven primero qué tér- 
minos pueden figurar en la expresión del polinomio dado mediante los polino- 
mios elementales y hi és los coeficientes de estos términos por el méto- 
do de los coeficientes indeterminados 

mplos, £- Hallar la expresión para el polinomio simétrico / = $ (xfa3) 
sabemos (véase la demostración del teorema fundamental) que los térmi 
nos del polinomio buscado «y (04, 02, . - ., On) se determinan mediante los térmi- 
nos superiores de los polinomios icos fis fas.. siendo inferiores estos 
términos al término superior del polinomio dado f, o sea, inferiores a xixl. 
Hallemos todos los productos 2... xy que satisfacen a las condiciones 
siguientes: 1) son inferiores al término z3x3; 2) pueden servir de términos superiores 
para los polinomios simétricos, o sea, satisfacen a las desigualdades 4 > la > 
> »  . > Ins 3) son de cuarto grado con respecto al conjunto de las indetermina- 
das (pues, como ya sabemos, todos los polinomios fı, fa, . . . tienen el mismo gra- 
do que el polinomio homogéneo f). Escribiendo solamente las combinaciones 
correspondientes de los exponentes e indicando al lado los productos de las 
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potencias de g determinados por ellos, obtenemos la tabla siguiente: 


905 
110... op to jloj dojo a; 

Vor lo tanto, el polinomio j tiene la forma 

103 -+ A0103 -BO%. 


Hemos hecho el coeficiente de az igual a la unidad, pues, esto término se deter- 
mina por el término superior del polinomio / que, como ya sabemos por la d 
tración del teorema fundamental, tiene este mismo coeficiente. Los coel 


= 0. Fácilmente se observa 


Pongamos 71 = ra= z3 = f, 24 =... In 
adas, el polinomio / toma el valor 


que, para estos valores de las 


3 y los polinomios Gi, 02; 03 Y Og, N lores 3.3, 1 y 0, respectivamente 
Por esto 

54-31 8-0, 
de donde A —2. Pongamos ahora xy = zs == xa 24 1, zg = n. = a 


= 0. Los valores de los polinomios f, 01, 07, 03 y 94 son 6, 4, 6, 4, Ù, respecti- 
vamente, Por esto, 
636--2:4:4-G 14, 


de donde #2, Por to tanto, la expresión buscada para f es 
1 201031204. 
2. Mallar la suma de los cubos de las raices del polinomio 
o ma 2. 
de este problema, hallen 


Para la resolució s la expresión mediante los 


polinomios simétricos elementales para el y o simétrico 5 (23). Aplican- 
¿lo el mismo método que en el ejemplo anterior, obtenemos la tabla 

3000 ... 07, 

2400... o 


111000. 0% 
y. por esto, 
S(p- 0P-|-40107+ 807. 

Poniendo primero xy z3: 1, 23=..- -- 3n 0, y después, 2, 29131, 
».=Zp 0, obtenemos, A — —3, H-3, 0 sea, 

S (ai) ==01—30,07-+ 303- az 

Para hallar la suma de los cubos de las raíces del polinomio f (+) dado, en 
virtud de Tas fórmulas de Vieta, en la expresión que hemos hallado hay que sus- 
tituir o, por el coeficiente de 23 con signo contrario, o sea, por —Í; 02, por el 
coeficiente de 2%, o sea, por 2; y, por fin, ds, por el coeficiente de z con signo 
contrario, o sea, por —1.. Por consiguiente, la suma de los cubos de las raíces 
que nos interesa es igual a 

(3 —)-2 5-3 4) 2. 

El Jector puede comprobar esto resultado teniendo en cuenta que las raíces 
de f(a) son: i, 44418 y — £ ¿VB Está claro también que la fórmu- 
la (12) no depende del polinomio j (z) dado y permite hallar la suma de los cubos 
de las raíces de cualquier polinomio. 
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El método obtenido en la demostración del teorema fundamen- 
tal para expresar un polinomio simétrico f mediante los polinomios 
elementales, conduce a un polinomio en di, 92, .. ., O, comple- 
tamente determinado. Resulta que de ningún modo se puede obtener 
para f otra expresión distinta mediante 0,, Oz, ..., On. Esto 

uestra el siguiente teorema de unicidad: 
\ Todo polinomio simétrico posee una expresión única en forma de un 
polinomio en los polinomios simétricos elementales. 

Demostremos este teorema. Si un polinomio simétrico 
Í (Zi Za, + « «, £n) sobre el campo P poseyese dos expresiones distin- 
tas mediante 01, Os -.-., Oni 


(Ei La, ++, En) =G (01, O2, -o +1 On 
la diferencia 
X (On Oz, -oey On) =F (0, On, -o -y On) —P (01, Dz, «+ -, On) 


sería un polinomio en 01, Oz, -. -, Op, diferente de cero, es decir, 
que no todos sus coeficientes serían iguales a cero, mientras que la 
sustitución en este polinomio de Oi, Oz, . . ., 0, por sus expresiones 
iante Zi, Ze, .. ., 2, nos daría el cero del anillo P |z,, zs, ... 
+++ Tpl. Por esto, no queda más que demostrar que, si un 
polinomio % (01, Oz, +... 0,) es diferente de cero, o sea, que tiene 
por lo menos un coeficiente diferente de cero, el polinomio 
B (Eis Ze, +. £p), obtenido de y sustituyendo Oj, Os, ..., Op 
por sus expresiones mediante Ti, Zo, +. ., 2,1 


=g (Tis La, -ooy Ta), (13) 


L (Ois Oz, +++ On 


es también diferente de cero. 

Si aohiols... on es uno de los términos del polinomio %, 
siendo a 4 0, entonces, como ya sabemos por la demostración del 
teorema fundamental, después de sustituir todas las o por sus expre- 
siones (1), obtenemos un polinomio en Zi, £2, . - -, Zn, cuyo término 
superior (en el sentido de la ordenación lexicográfi 


arar... (rn) =az hala... ala, 
donde 
hl kl o Hkn 
la corn, 
z= 


De aquí resulta, 


ki=l— lin ka= lm 
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o sea, conociendo los exponentes Z, la, . - -, la se pueden restituir 
los exponentes ki, kz, - - -, kn del término inicial del polinomio y. 
Por lo tanto, distintos términos del polinomio y, considerados como 
polinomios en zn Za, ---, Za, tienen términos superiores dife- 
rentes. 

Consideremos ahora todos los términos del polinomio y; para 
cada uno de ellos, hallemos el término superior de su expresión en 
forma de un polinomio en Z;, Za, . - ., Za Y entre estos términos supe- 
riores elijamos el que sea superior en el sentido de la ordenación 
loxicográfica. Como ya se advirtió antes, este término no tiene 
semejantes entre los términos superiores que se obtienen de los 
demás términos del polinomio y y, como por la condición, este 
término es superior a cada uno de estos términos superiores, es supe- 
rior, por consiguiente, a todos los demás términos que se obtienen 
sustituyendo los elementos 0, Os, .... 0, en los términos del 
polinomio y por sus expresiones (1). Por lo tanto, hemos hallado un 
término que, al pasar de % (01, 02, -.., On) a g (Ti, Ta, +... Zo), 
aparece (con un coeficiente diferente de cero) una sola vez, por lo 
cual, no puede simplificarse con ninguno. De aquí se deduce que no 
todos los coeficientes del polinomio g (21, £2, . . .. £n) son iguales 
a cero, o sea, que este polinomio no es el cero del anillo Ê lz,, zo, .. 

nl, como se quería demostrar. 

Es evidente que el teorema demostrado se puede enunciar tam- 
bién del modo siguiente: 

El sistema de los polinomios simétricos elementales 01, Os, ++ On, 
considerados como elementos del anillo de los polinomios P |z, xa, 
+. +, Ep], es algebraicamente independiente sobre el campo P. 
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Observaciones sobre el teorema fundamental. La demostración 
del teorema fundamental de los polinomios simétricos expuesta 
en el párrafo anterior, permite hacer algunos complementos esen- 
ciales al enunciado del teorema, los cuales se aplicarán más adelante. 
Ante todo, los coeficientes del polinomio @ (01, Oz, ---, On); 
hallado como expresión del polinomio simétrico f (ts, Ze. - 
mediante los polinomios simétricos elementales, no sólo pertenecen 
al campo P, sino que se obtienen incluso de los coeficientes del poli- 
nomio f aplicando las operaciones de adición y sustracción, o sea, 
pertenecen al anillo L engendrado por los coeficientes del polinomio f 
dentro del campo P. H 

En efecto, como fácilmente se observa, todos los coeficientes del 
polinomio q, (véase la fórmula (5) del párrafo precedente) son, con 
respecto a las indeterminadas zı, Tz, ++ ++ Tn: múltiplos enteros 
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del coeficiente ay del término superior del polinomio f y, por lo 
tanto, pertenecen al anillo L. Supongamos que ya está demostrado 
que pertenecen a L todos los coeficientes (con respecto a T4, Zo, $ 

-+ Za) de los polinomios «ps, Pz, - - -» Pr, entonces, los coeficien- 
tes del polinomio f; = f — pı — Ga — ..- —, también perte- 
necen a L y, por ende, pertenecen también a L todos los coeficientes 
del polinomio «+, con respecto a Zy, La, ..., Zn- 

Por otra parte, el grado del polinomio q (01, Oz, . .., On) con 
respecto al conjunto 01, Os, ..., Op es igual al grado que tiene el 
polinomio f (£1, Ze, . - =+ Zn) con respecto a cada una de las indeter- 
minadas z;. En efecto, como, por el párrafo anterior, (2) es el término 
superior del polinomio f, k, es el grado de f con respecto a z; y por 
esto, en virtud de la simetría, es también el grado de f con respecto 
a cualquiera otra de las indeterminadas z;. Mas, por la igualdad (5) 
del párrafo anterior, el grado de q, con respecto al conjunto o es 
igual al número 


la 


2) + (ka — ka) ina — Kin) > 


Por otra parte, como el término superior del polinomio f, es inferior 
al término superior del polinomio f, el grado de f; con respecto 
a cada x, no será superior al.grado de f con respecto a cada una de 
stas indeterminadas. Pero el polinomio , desempeña para f; el 
mismo papel que q, para f, por consiguiente, el grado de q» con 
respecto al conjunto o es igual al grado de f, con respecto a cada zy, 

a etc. Por lo tanto, el grado de y (03, 0%, - -- 
-e On) tampoco es mayor que k,. Pero, como ninguna q, con 
¿"1, puede contener todas las 04, 02, . - ., 0, elevadas a las mis- 
mas potencias que pı, el grado de q (04, Gz, - . -, On) es exactamente 


n = hege 


igual a ky, Con esto, nuestra proposición queda demostrada. 
Sı finalmente, «Oj uno de los términos del 
polinomio q (01, a,  - ., Gn). Llamemos peso de este término al 


número 


o sea, a la suma de los exponentes multiplicados por los índices que 
corresponden a o;. En otras palabras, como se deduce del teorema 
del grado de un producto de polinomios, demostrado en el $ 51, 
el peso os ol grado del término que considoramos con respecto 
al conjunto de las indeterminadas 2,, Te Ta. Entonces, se 
verifica la siguiente proposición: 

Si un polinomio simétrico homogéneo f (z4, £e, . . ., zn) es de 
grado s con respecto al conjunto de las indeterminadas, todos los términos 
de su expresión P (O1, 02, - . -, On) mediante o tienen un mismo peso, 
igual a s. 
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En efecto, si (2) del párrafo anterior es el término superior del 
polinomio homogéneo f, se tiene 


kit ka 
Mas, el peso del término q, según (5) del párrafo precedente, es 
igual a 

(h 


vo H Rne 


H2 (ka— ka) -o + (0—1) (ka-1 — ka) 1 nka = 
=kit katkat > + kn 


o sen, también es igual a s. Luego, el polinomio fi = f — 91, como 
diferencia de dos polinomios homogéneos de grado s, también es un 
polinomio homogéneo de grado s y, por esto, el peso del término qu 
del polinomio q también es igual a s, ete. 

Fracciones racionales simétricas. El teorema fundamental de 
los polinomios simétricos se puede generalizar para el caso de fraccio- 


nes racionales, Llamenos simétrica a la fracción racional L en re inde- 


terminadas zy, Z2, - + -» Zn, Si se mantiene igual a sí misma al hacer 
cualquier permutación de las indeterminadas. Fácilmente se demues- 


tra que esta definición no depende de que se tome la fracción Ll o una 
fracción Lo. 

o 
de las indeterminadas y q es un polinomio arbitrario en estas inde- 
terminadas, convengamos en designar con q" el polinomio en que se 


transforma q al efectuar la permutación wœ. Según la hipótesis, para 
cualquier œ, se tiene, 


equivalente a ella, En efecto, si œ es una permutación 


o sea, fg® = gf". Por otra parte, de la igualdad 

tte 

Eo 
resulta, /go= gfo, de donde /“g2=g"/7. Multiplicando por f ambos 
miembros de la última igualdad, obtenemos: 


Hes = tefe =gf° l, 


de donde, después de simplificar por j°, resulta: fg2=g/0, o sea, 


Se verifica el siguiente teorema: 
Toda fracción racional simétrica en las indeterminadas zı, z», -.. 
£, con coeficientes del campo P, se expresa en forma de una 
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fracción racional en los polinomios simétricos elementales 01, O2, 
- + ., On, con coeficientes pertenecientes de nuevo a P. 
En efecto, sea dada una fracción racional simétrica 
[as ana) 
OC] 


Suponiendo que ésta es irreducible, se podría demostrar que, tanto f 
como g, son polinomios simétricos. Sin embargo, el camino que se 
sigue a continuación es el más sencillo. Si el polinomio g no es 
simétrico, multiplicamos el numerador y el denominador por el 
producto de todos los n! — 1 polinomios que se obtienen de g efec- 
tuando todas las sustituciones posibles no idénticas de las indetermi- 
nadas. Fácilmente se comprueba que ahora el denominador es un 
polinomio simétrico. En virtud de la simetría de toda la fracción, 
de aquí se deduce ahora que el numerador es también simétrico y, 


por esto, para la demostración del teorema no queda más que expre- 
ador mediante los polinomios simótricos 


sar el numerador y denomi 
elementales, 

Sun 
los polinomios simétricos sx 
o sea, las sumas de las potencias k-ésimas de las indeterminadas 
Zi, lay . --3 Zn. Estos polinomios, llamados sumas de potencias, 
tienen que expresarse mediante los polinomios simétricos elemen: 
tales, según el teorema fundamental. Sin embargo, es bastante difícil 
encontrar estas expresiones para valores grandes de k y, por lo tanto, 
ofrece interés la relación existente entre los polinomios si, sz, + + . 
Y 01, 02, -. -) On, que se va a establecer ahora. 

n primer lugar, sı = 01. Por otra parte, siendo k<n, fácil- 
mente se comprueba que se verifican las igualdades: 


Shi sa ES (aj ia) *, 


Sata) j S (aj taa), 


ri, = S (A. 2i) HS (Et 


Or-1= S (ajos... 2-1) = kOn- 


Tomando la suma alternada de estas igualdades (o sea, la suma con 
los signos alternados), y pasando después todos los términos a una 
parte de la igualdad, obtenemos la fórmula siguiente: 


(MA 51094 (— 1)" kar=0 (k 


* Véase (11) del párrafo precede 


n). (2) 


Sh — Sp 101 


e. 
22° 
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Si k>n, el sistema de igualdades (1) toma la forma: 


$110 =0% 28 (ela, 


520 = S (ata) + S (h7 


Sai 


Shi = 


Shin 


de donde se deduce la fórmula 
0=0 (k>n) (3) 


Las fórmulas (2) y (3) se Haman fórmulas de Newton, Estas ligan 
a las sumas de potencias con los polinomios simétricos elementales 
y, por consiguiente, permiten hallar sucesivamente las expresiones 
de sy, Sa, Sa... mediante 04, 0: ms Gn. Asi, pues, ya sabemos 
ques, = dy, lo cual se deduce también de la fórmula (2). Sik =2.<n 
entonces, en virtud de (2), se tiene ss — S10, -+ 0, de donde 


Sh — Sh-101 i Sa-202— ++ (— 1)" 5) 


0 
s= 0}— 203. 


0, de donde, aplicando 
obtenemos: 


A 
$50 ay 


lo cual ya conocemos (véase (12) del párrafo precedente). Si k = 3, 
pero n = 2, por (3) se tiene s3 — 5204 -+ s¡00 = 0, de donde sy 
= a? — 30,9. Aplicando las fórmulas de Newton, se puede obtener 
una fórmula general que exprese s, mediante dy, 07, - - +, Gn. Pero, 
debido a la complejidad de esta fórmula, omitimos su exposición. 
Si el campo fundamental P es de característica O y, por lo tanto, 
tiene sentido la división por cualquier número natural n*, la fórmu- 
la (2) permite expresar sucesivamente los polinomios simétricos 
elementales 0;, Oz, + On, mediante las primeras n sumas de 
potencias Si, Say + + Asi, pues, 0, = Si, Y, por esto, 


Oz 


+ lso — s) =F (53) 


o= (as + s10) = (83824255) 


etc. De aquí, y del teorema fundamental, se desprende el siguiente 
resultad 


* En un campo de característica p, la expresión + carece de sentido si 
a 0, pues, en este campo, para cualquier z, se tiene pz = 0. 
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Todo polinomio simétrico en n indeterminadas Zi, Za, ..., Zn, 
sobre un campo P de característica cero, se puede expresar en forma 
de un polinomio en las sumas de potencias Si Sz, . . «, Sn con coefi- 
cientes pertenecientes al compo P. 

Polinomios simétricos con respecto a dos sistemas de indeter- 
minadas. En el siguiente párrafo, así como en el $ 58, se va a utilizar 
una generalización del concepto de polinomio simétrico. Sean dados 
dos sistemas de indeterminadas, Zi, Te, --., Zn © Yi Yar +». Yro 
donde su unión 

Y (4) 


es algebraicamente independiente sobre el campo P. Un polinomio 
Í (Es, Zas esas Imp Vis Yes > + + Ur) Sobre el campo P se llama 
simétrico con respecto a los dos sistemas de indeterminadas, si no varía 
al hacer cualesquiera permutaciones de las indeterminadas 
Xy Zo, +. ., Za entre sí y de las indoterminadas y, Jo, -+ Yr 
entre sí. Si para los polinomios simétricos elementales en 21, 2, » ++ 
<- «y 2, conservamos las notaciones o1, 02, . . :, On, Y designamos 
com Ti, Tes -+s Tre los polinomios simétricos elementales en 
Vis Ves -ss Yr, Cl teorema fundamental se generaliza del modo 
siguiente 

Todo polinomio f (£y, z3, «+ -y Zn, Yis Ve - + => Yr) sobre el campo 
P, que es simétrico con respecto a los sistemas de indeterminadas 
Ti, Eo, e i En € Yis Yas » +, Yr, Se expresa en forma de un poli- 
nomio (con coeficientes de P) en los polinomios simétricos elementales 
respecto de estos dos sistemas de indeterminadas: 


Pr aT) 


En efecto, el polinomio f se puede considerar como un polinomio 
Wir Yes » > =+ yr) de coeficientes que son polinomios en 1y, Ze, --- 
- +=, Xu: Como f no varía al permutar las indeterminadas 7,, 2. 
< <., æn, los coeficientes del polinomio F serán polinomios simótri- 
cos en Zi, Ze, - - -» Tn, por lo cual, en virtud del teorema fundamen- 
tal, se expresan en forma de polinomios (con coeficientes de P) 
en 01, Oz, «+ «y On- Por otra parte, el polinomio f (Ys, Y2, + = Y+)» 
considerado sobre el campo P (zi, Zo, - .., Ta), es simétrico con 
respecto a ys, Yes + + > Yr por lo cual, so expresa en forma de un 
polinomio q (Ti, Te, - « =, T). Como se ha mostrado al principio del 
presente párrafo, los coeficientes del polinomio Ẹ se expresan median- 
te los coeficientes del polinomio f mediante la suma y la resta y, por 
consiguiente, también son polinomios en 04, 02, .  ., Op. Eviden- 
temente, esto nos conduce a la expresión buscada de f mediante 
Ots Ors eoor Ons Tis Tes oe er Tre 


Zir Tn seer Ins Yn Yn + 


tetr Tms Yn Yas ees Yr) = O (On On, +++ Ons Tas Tas 
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Ejemplo. El polinomio 
Pts 


Fa Yis Ya) Lp rar — Fara yray 
E E TiyyYa Faya F- TayYa 


es simétrico con respecto a las indeterminadas zı. z2, za, asi como con respecto 

a las indeterminadas y, ya, pero no es simétrico con respecto al conjunto de 

todas las cinco indeterminadas, la cual se observa trasponiendo las indetermi- 

nadas z; e pı. Mallemos la expresión de f mediante 01, 02, 03, Tis Tat 

121 1929 (izo |-Zyr3-i-Zgt3) Y — (2172 
Ear 172-425) YiYa — 03 — 0241 — OaYo | OY Y: 


Tits — 


titat 
oy—drti tot 

Naturalmente, el teorema que se acaba de demostrar se generaliza 
también al caso de tres y de un número mayor de sistemas de inde- 
terminadas. 

Para los polinomios que son simétricos con respecto a dos siste- 
mas de indeterminadas se verifica también el teorema de unicidad 
de la representación mediante los polinomios simétricos elemen- 
tales. En otras palabras, se verifica el siguiente teorema: 
sistema unido 


Op Oz ---1 On, Tis Tay eses Tr 


de polinomios simétricos elementales en los sistemas dados de indetermi- 
nadas zy, Zas + «01 Tn € Yi, Yz, > >= Yrs es algebraicamente indepen- 
diente sobre el campo P. 

En efecto, supongamos que existe un polinomio 


P(T Oz, <- -y Ons Tis Tar +++ Tr) 


sobre el campo P, que es igual a cero, a pesar de que no todos sus 
coeficientes son iguales a cero. Este polinomio se puede considerar 
como un polinomio 3p (ti, Te, .--» T) de coeficientes que son 
polinomios en 91, oz, - . .» da: Por consiguiente, se puede suponer 
que p es un polinomio en Ti, Tz, « - + Tr Sobre el campo de frac- 
ciones racionales: 


Q=P (z, Ta, - - <, 2n). 


El sistema yi, Yz - y, se mantiene algebraicamente indepen- 
diente sobre el campo Q, pues, si para este sistema existiese una 
dependencia algebraica con coeficientes de Q, eliminando los deno- 
minadores obtendríamos una dependencia algebraica en el siste- 
ma (4), en contra de la hipótesis. Basándose en el teorema de unicidad 
del párrafo anterior, resulta ahora que el sistema ti, To, -- -, Tr 
también tiene que ser algebraicamente independiente sobre ol campo 
Q y, por esto, todos los coeficientes del polinomio w son iguales 
a cero. Pero, estos coeficientes son polinomios en 01, O2, . +» Ons 
por lo cual, de nuevo, en tud del teorema de unicidad para el 
caso de un sistema de indeterminadas (esta vez, para el sistema 
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Xi ay «=> Tn), los mismos coeficientes de estos últimos polino- 
mios son iguales a cero. Con esto queda demostrado que, en contra 
de la hipótesis, todos los coeficientes del polinomio ọ tienen que 
ser iguales a cero. 


$ 54. Resultante. Eliminación de una indeterminada. 
Discriminante 


Dado un polinomio f (Z4, Z2, 
- « ., 2a), se lama solución del 
las indeterminadas 

T= lp T= Ar, 


Zn) del anillo P [z1 ze,- - 
mo a mn sistema de valores de 


+ n= an, 


tomados en el campo P o en 
que convierte en cero al pol 


Fs, Lor -er Un) =0. 


alguna ampliación P de esto campo, 
¡omio 


Todo polinomio f, cuyo grado sea mayor que cero, posee soluciones. 
En efecto, si la indeterminada z, figura en la expresión de este 
polinomio, entonces, se pueden tomar por %2, . . -, % los olementos 
arbitrarios del campo P, con la condición solamente de que el grado 
del polinomio f (z4, œz, + +.» %n) se mantenga estrictamente posi- 
tivo, y después, aplicando el teorema de existencia de la raíz ($ 49), 
se puede tomar una ampliación P del campo P, en Ja que el polinomio 
(ti Uo >. .+ Un) en una indeterminada z, tenga una raíz ay. 
A Ja vez, observamos que la propiedad (de los polinomios de grado 
n en una indeterminada) de poseer en cualquier campo no más de n 
raices, no se cumple para los polinomios en varias indeterminadas. 

Dados unos cuantos polinomios en n indelerminadas, se puedo 
plantear el problema del cálculo de las soluciones que son comunes 
a todos ellos, o sea, de las soluciones del sistema de ecuaciones que 
resulta al igualar a cero los polinomios dados, En el segundo capítulo 
se estudió detalladamente un caso particular de este problema, 
precisamente, el caso de sistemas de ecuaciones Jineales. Sin embar- 
go, en el caso particular inverso de una ecuación en una indeter- 
minada, pero de grado arbitrario, no sabemos nada sobre las raíces, 
a excepción de que éstas existen en cierta ampliación del campo 
fundamental. Naturalmente, la búsqueda y el estudio de las solu- 
ciones de un sistema no lineal de ecuaciones en varias indetermi- 
nadas es un problema más complicado que, por cierto, está fuera de 
Jos márgenes de nuestro curso y es el objeto de una rama de las mate- 
máticas, denominada geometría algebraica. ¿Aquí nos limitaremos 
solamente al caso de un sistema de dos ecuaciones de grado arbi- 
trario en dos indeterminadas y demostraremos que éste se puede 
reducir al caso de una ecuación en una indeterminada. 
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Ocupémonos primero del problema de la existencia de 


comunes de dos polinomios en una indeterminada. Sean dados los 
polinomios 
$ (2) = aoz” + aja Uni -b ün, t 
g (2) = boz" + bat bst- be o 


sobre el campo P, siendo as + O, ba + 0. 

De los resultados del párrafo precedente, sin dificultad alguna 
se deduce que los polinomios f (x) y g (x) poseen raiz común en cierta 
ampliación del campo P cuando, y sólo cuando, éstos no son primos 
entre sí. Por lo tanto, el problema de tencia de raíces comunes 
para los polinomios dados se puede resolver aplicándoles el algoritmo 
de Euclides 

Ahor 


odo para dar una respuesta a este 
problema. Sea P una ampliación tal del campo P, en la que f (2) 
tenga n raices æy, dz,- . -, Las y g (x) tenga s raices, Bi, Bas.. Bas 
por P se puede tomar el campo de descomposición del producto 
$ (0) g (2). El elemento 


24.008 1 et B 


del campo FP se llama resultante de los polinomios f (+) y g (2). Es 
evidente que f (2) y g (£) poseen en P raíz común cuando, y sólo cuando, 
(U, g) - 0. Como 


g(a) = b l] (PB) 
se tiene, 
g(a) = bo [| (Ba): 
la resultante X (/, g) se puede expresar también en la forma 
RGH, g)= as L] g (2). 0) 


En la definición de la resultante, los polinomios f(z) y g(x) 
no se emplean de un modo simétrico. En efecto, 


Re, N= wai 1] I (8,0) = (D RU, e) (4) 
En correspondencia con (3), R (g, f) se puede expresar en la forma 


Rie, 00 f] 10). © 
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La expresión (2) para la resultante exige conocer las raíces de los 
polinomios f (z) y g (2) y, por esto, prácticamente es inútil para la 
resolución del problema de la existencia de una raíz común de estos 
polinomios. Sin embargo, resulta que la resultante R (f, g) se puede 
expresar en forma de un polinomio en los coeficientes ag, ay, - . - 

<s An, bo, Dj, ., ba de los polinomios f(x) y g (2). 


La posibilidad de tal representación se deduco fácilmento de los resultados 
del párrafo anterior. En efecto, la fórmula (2) muestra que la resultante X (J, g) 
es un polinomio simétrico en dos sistemas de indeterminadas: en el siste 
Gs, z, «+ Un y en el sistema Pi, Ba, ..., Ba- Por esto, como se demostró al 
del párrafo anterior, ésta so representa en forma de un polinomio en los polino- 
mios simétricos elementales en estos dos sistemas de indeterminadas, o sea, 
en virtud de las fórmulas do Vieta, en forma de un polinomio en los cocientes 


a bi, incluido en '(2), 


La expresión que hallaremos para la resultante de los polino- 
mios (1) será válida para cualquier par de estos polinomios. Precisan- 
do, se supondrá que el sistema de raíces 


(6) 


de los polinomios (1) es un adas inde- 
pendientes, o sea, es un sistema de n +s elementos, algebraicamente 
independiente sobre el campo P en el sentido del $ 51. 

Obtendremos una expresión para la resultante que, considerada 
como un polinomio en las indeterminadas (6) (después de sustituir 
los coeficientes mediante las raíces por las fórmulas de Vieta), será 
también igual al segundo miembro de la igualdad (2), considerado 
también como un polinomio en las indeterminadas (0). 

Entendiendo la igualdad precisamente en el sentido de identidad 
con respecto al sistema de las indeterminadas (6), demostraromos que 
la resultante R (f, g) de los polinomios (1) es igual al siguiente deter- 
minante de orden n + s: 


A 


AA 
e Bi ar E s filas 

da a $ 

iai l T E a uy 
do La de n filas 
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(en los lugares libres figuran ceros). La estructura de este determi- 
nante está suficientemente clara; señalemos solamente que en su 
diagonal principal figura s veces el coeficiente a, y, después, n veces 
el coeficiente bs. 

Para la demostración de nuestra afirmación, calcularemos de dos 
modos el producto azb3DM, donde M es el siguiente determinante 
auxiliar de orden n + s: 


pro pr NN antt 
o Para apt- antt? 


pres pre 


M es el determinante de Vandermonde y, por esto, como se indicó 
en el $ 6, es igual al producto de las diferencias de los elementos de 
su penúltima fila, donde, de cada elemento precedente se resta 
cualquier elemento posterior. Por lo tanto, 


e, 
U= BA ade EPN 
il 000 4 À 0000, Y, (00) 
de donde, en virtud de (4), 
GDM =D-R (e, N- I Bb, (uña. (6) 
Por otra parte, calculemos el producto DM basándonos en el 
teorema del determinante del producto de las matrices. Multi- 


plicando las matrices correspondientes y teniendo en cuenta que todas 
las az son raíces de f (x) y todas las f son raíces de g (z), obtenemos: 


aib DM = 


BITH) BE'S Ba) -BITA B) 0 De ros > 30 
ACABO BETA Ba BAG) 0 0 o 
BAO) Paf) -o Baf (Ba) 0 0 0 
FB) FB) - fa) o 0 0 
0 O a O  ag-ig(a,) ari (as).. ante (dn) 
0 O a AO tela) 05-98) 
o asg (a) ag (a2) Ong (an) 


0 © se Ü g(a) El)... Blan) 


$ 54. Resultante. Eliminación de una indeterm. Discriminante 347 


Aplicando el teorema de Laplace, sacando después los factores 
comunes de las columnas de los determinantes y calculando los 
determinantes que quedan como determinantes de Vandermonde, 
resulta: 


00M =a Ù iG) 16:80) 
Ye es 


o bien, aplicando (3) y (5), 
ADM =R, DRE D p br, um O 


Ha resultado que los segundos miembros de las igualdades (8) 
y (9), considerados como polinomios en las indeterminadas (6), 
son iguales entre sí. Ambos miembros de la igualdad obtenida se 
pueden simplificar por sus factores comunes, que no son idéntica- 
mente iguales a cero. El factor común R (g, f) no es igual a cero, 
En efecto, como por la hipótesis, ap + 0 y bo 0, es suficiente 
elegir para las indeterminadas (6) valores que no sean iguales entre sí 
(en el campo fundamental o en alguna ampliación del mismo), para 
obtener en (4) un valor diferente de cero del polinomio R (g, f). 
Del mismo modo se demuestra que los otros dos factores comunes 
son diferentes de cero. Simplificando por todos estos factores comu- 
nes, llegamos a la igualdad: 


R(g=D (10) 


| et), Y Cua, 


como se quería demostrar. 

Desistamos ahora de la condición de que los coeficientes superiores 
de los polinomios (1) sean diferentes de cero *. Por consiguiente, 
acerca de los grados verdaderos de estos polinomios solamente se 
puede afirmar que éstos no son superiores a sus grados «formales» 
n y s, respectivamente. Ahora, la expresión (2) para Ja resultante 
carece de sentido, pues, posiblemente, los polinomios considerados 
tienen una cantidad de raíces menor que n o s. Por otra parte, ahora 
también se puede escribir el determinante (7) y como ya está demos- 
trado que, siendo ay 0, bọ 0, este determinante es igual a la 
resultante, le llamaremos también, en el caso general, resultante 
de los polinomios f (2) y g (z), designándole con la notación R (f, 8) 

Pero ya no se puede asegurar que la igualdad a cero de la resul- 
tante es equivalente a la existencia de una raíz común de nuestros 


* El hecho de que por ahora nos neguemos de la condición que habíamos 
impuesto al cocficiente superior del polinomio, se debe a las aplicaciones 
ulteriores, puesto que queremos estudiar los sistemas de polinomios en dos indo- 
terminadas, refiriendo un 
el coeficiente superior puede an 
indeterminada. 


de éstas a los coeficientes. Por consiguiente, 
rse para valores particulares de esta 
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polinomios. En efecto, si ay = 0 y bọ —— 0, resulta que R (f, g) = 0, 
independientemente de que tengan los polinomios f y g raíces comu- 
nes o no, Sin embargo, éste es el único caso en que de la igualdad 
a cero de la resultante no se puede hacer la conclusión de que existen 
raíces comunes de estos polinomios*. Precisando, se verifica el 
siguiente teorem: 

Dados los polinomios (1) con cualesquiera coeficientes superiores, su 
resultante es igual a cero cuando, y sólo cuando, estos polinomios 
tienen una raíz común, o bien, cuando ambos coeficientes superiores 
son iguales a cero. 

Demostración. El caso en que ags 0, bas 0, ya se estudió 
anteriormente y el caso en que ay = ba = Ù se tiene en cuenta en el 
enunciado del teorema. No queda más que considerar el caso en que 
uno de los coeficientes superiores de los polinomios (1), por ejemplo ao, 
es diferente de cero, mientras que bọ es igual a cero. 

Si b; = 0 para todos los ¿,¿ = 0, 1, ...., s, entonces R (f, g) = 
= 0, pues el determinante (7) contiene filas que constan de ceros. 
Pero, entonces el polinomio g (z) será idénticamente igual a cero, 
por lo cual, tendrá raíces comunes con f (2). 


di=bi=...=b=0, pero 1170, KLS, 


Ele) Eo Phi 


entonces, sustituyendo por ceros los elementos bo, Di, -s ba- 
en el determinante (7), y aplicando el teorema de Laplace, obtene- 
mos, evidentemente, la igualdad: 


Ri, g) 


Sin embargo, como los coefi 


(1) 


ntes superiores de ambos polino- 


mios f y g son diferentes de cero, por lo demostrado anteriormente, 
la igualdad R (f, g) = 0 es condición necesaria y suficiente para la 
existencia de una raíz común de los polinomios f y g. Por otra parte, 
en virtud de (11), las igualdades R (f, g) = 0 y R (f, g) = 0 son 
equivalentes, y como los polinomios g y g tienen raíces iguales, 
obtenemos que, en el caso considerado, la igualdad a cero de la 
resultante Z (f, g) es equivalente a la existencia de una raíz común 
„de los polinomios f (zx) y g (z). Con esto, el teorema queda demostrado. 


'aturalmente, el determinante (7) también es igual a cero cuando ap = 
0. Mas, en este caso, los polinomios (1) tienen la raíz común D. 
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Hallemos la resultante de los dos polinomios cuadrados 
1) =p ayrt am g (1) = boz? + biz bg. 

Según (7) 
ag a, az 0 
O ao a, az 
bo bi ba 0 
O bo by da 


o, calculando el determinante, desarrollándolo para esto por la primera 
y tercora filas, 


R (f, g) = (20b2—azbo)?— (aob; — abo) (arba — azb). (12) 
Así, pues, dados los polinomios 
f=2-042 gl)=2% r 


en virtud de (12), se ti RU, g) 233, 
ticnen raices comunes. | los polinomios 


Ha) 224135, glr) 


Ri, 8)= 


y por esto, estos polinomios no 


72410, 
se tiene, A (J, g) = 0, o sea, estos polinomios tienen una raíz común e igual a 5, 


Eliminación de una indeterminada en un sistema de dos ecuaciones 
con dos indeterminada. Sean dados dos polinomios f y g en dos 
indeterminadas z e y, con coeficientes pertenecientes a un campo P. 
Escribiremos estos polinomios según las potencias decrecientes de 
la indeterminada z: 


$ (x, y) = ao (y) 7 a (y) 24 an-s (y) £ + an (y), 13 
genb nato $ 0 


los coeficientes son polinomios del anillo P [yl. Hallemos la resul- 
tante de los polinomios f y g, considerados como polinomios enx. 
y designémosla mediante A. (f, g); en virtud de (7), ésta es un poli- 
nomio en una indeterminada y, con cos ientes del campo P: 


Rx (f, g)= F (y). (14) 


Supongamos que el sistema de polinomios (13) posee una solu- 
ción común z = æ, y = f en una ampliación del campo P. Ponien- 
do en (13), en lugar de y el valor P, obtenemos dos polinomios, 
f (e, B) y g (2, B), en una indeterminada z. Estos polinomios tienen 
una raíz común % y, por consiguiente, su resultante, que en virtud 
de (14), es igual a F ($), tiene que ser igual a cero, o sea, f tiene que 
ser raíz de la resultante R, (f, g). Reciprocamente, si la resultante 
R. (f, g) de los polinomios (13) tiene una raíz B, la resultante de los 
polinomios f (z, B) y g (z, $) es igual a cero, o sea, o bien estos 
polinomios tienen una raíz común, o bien sus coeficientes superiores 


son iguales a cero, 
ao (B) = bo (B) =0. 
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De este modo, el cálculo de las soluciones comunes del sistema 
de polinomios (13) se ha reducido al cálculo de las raices de un poli- 
nomio (14) en una indeterminada y, o sea, como está convenido 
decir, se ka eliminado la indeterminada x en el sistema de polino- 
mios (13). 

El teorema que sigue responde a la pregunta 
que se obtiene al eliminar una indeterminada en u 
en dos indeterminadas; 

Si los polinomios f (z, y) y g (=, y) tienen con respecto al conjunto de las 
indeterminadas los grados n y s, respectivamente, el grado del polinomio Ry (f, g) 
con respecto a la indeterminada y no es mayor que el producto ns, naturalmente, 
si este polinomio no es igual a cero idénticamente. 

Ante todo, si so consideran dos polino 
coeficientes superiores iguales a la unidad. 
polinomio homogéneo en ær, az, - 0 Bs 
so deduce que, si en la expresión d ultante medi 
Gis Ags oe Uno Oy, Doy +», O figura el término 


sbre el grado del polinomio 
stema de dos polinomios 


nı una indeterminada con los 
a resultante J (/, g) es un 
Ba de grado ns. De aquí 

nte Jos coeficientes 


al armo i 
patt... apoioa... bl 
y si ol número 
A H nka Hlg- 2Ha oo H sla 

lo denominamos peso de esto término, todos los términos de la expresión de 
R (f, g) mediante los coeficientes tienen un mismo peso, igual a ns. Esta proposi- 
ción es verídica tambión en el caso general para los términos de la resultante (7), 
si so llama peso del término ago aht ... a" blo Bl... bi al número 


Orko-t teket «Pak Ordo + tlg. Hsls. (15) 


En efecto, sustituyendo en los términos del determinante (7) los factores ao y, bo 
pos, la unidad, llegamos al caso ya considerado, pero los exponentes de estos 
lactores figuran en (15) con los coeficientes 0. 

Escribamos ahora los polinomios f y g en la forma siguient 


Í (2, y) = ao (y) 24 as (y) 1"~t hn (y)s 

E (z, y)= bo (4) 2%: ba (y) 2*1- Hbo (v) 
Como n es el grado do Y (z, y) con respecto al conjunto de las indeterminados. el 
grado del coeficiente a, (y), r = 0, 1 , n, no puede ser mayor que su indi 
Eo esto mismo es ierte tambión para br Ùy). De aquí so deduco, que el grado 


de cada término de la resultante Rx (f, g) no esmayor que el peso de este Lérmi- 
no, o sea, no es mayor que el número ns, como se quería demostrar. 


Ejemplos. 
1. Hallar las soluciones del sistema de polinomios 


tz, v) R 2443, 
g (z, y) =27y —21--2y-3. 


Eliminemos la indeterminada z en este sistema, para lo cual, lo escri- 
bimos en la forma: 

(r. y) = ya laz 

8 (z, v) = (2y—2) z+ (2y 


10 
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entonces, 
Y dy y3 

Rx (f. g)—=|2y—2 2y+3 0 

0 2y—2 2-3 

As þe = — 


indeterminada y, los coeficientes superiores de los polinomios (16) no se anulan 
y. por esto, cada uno de ellos, junto con cierto valor de z, forma una solución 
del sistema dado de polinomios. Los polinomios 


He. —4)= 411215, 


pla =)= 1075 


y, 


3 


Las raíces de la resultante son: fi + Para estos valoros de la 


tienen una raíz común, a= 


TA 
e(a- 


común æ= 0. Por lo tanto, el sistema dado de polinomios 


+ Los polinomios 


tienen una 
tiene dos 


—4 y oO. Pa 


2. Eliminar una indeterminada en el sistema de polinomi 
He y) 22%y—=xy2 5 
Ela y) — rty? 2ry?—5y “1 


Como estos dos polinomios son de grado 2 con respecto a la indeterminada y, 
mientras que uno de ellos es de grado 3 con respecto a la indeterminada +. con- 
viene eliminar la y. Escribamos el sistema en la forma 


Hen a)y? 1- (27%) y (2-5), ) 
g (z. y) — (12-422) y?-5yo1 


an 


y hallemos su resultante, aplicando la fórmula (12): 
Ry (h g)=1(—2):1— (2+5) (222, 2x)]3— 
— (1) (—5)— 2r (z3 -| 2x)] [229-1 — (2-5) (—5)] 
54x5} Ba? | 11208428 |- AGUDAS 9072 — 125r. 


Una de las raíces de la resultante es igual a 0, Sin embargo, para este valor 
de la indeterminada z, ambos coeficientes superiores de los polinomios (17) 
se convierten en cero, y, además, como fácilmente se observa, los polinomios 
[LO 0) Y, £.60. y) no Genen raíces comunes. No conocemos un método para hi- 
lar las otras raíces de la resultante. Solamente se puede afirmar que si las h 
llásomos (por ejemplo, en el campo de descomposición de t,(/, £)), ninguna 
de ellas “anularía a ambos coeficientes superiores de los polinomios (17) 
y. por esto, cada una deestas raíces, j tto valor de y (con uno, e inclu- 
so con varios) formaría una solución del sistema dado de polinomios. 
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Existen métodos que permiten eliminar sucesivamente las 
indeterminadas en un sistema con un número arbitrario de polino- 
mios e indeterminadas. Pero estos métodos son demasiado complica- 
dos, por lo cual, no pueden ser incluidos en nuestro curso. 

Discriminante. Por analogía con el problema que nos ha llevado 
al concepto de resultante, se puede plantear la cuestión sobre las 
condiciones según las euales un polinomio f (z) de grado n del anillo 
P [xl posee raices múltiples. Sea 


Ho = aor" ~- aya" ~ -4T -ian to 0, 


y supongamos que en cierta ampliación del campo P este polinomio 


tiene las raíces dy, %o, ..., Uy. Evidentemente, entre estas raíces 
hay iguales cuando, y sólo cuando, es igual a cero el producto 
N= (a — 01) (03 —%4) >> > (Un — a) X 
(2r — Aa) (a =~ Aa) > + (An — a) X 


A) 


denominado discriminante del polinomio f (+). 

A diferencia del producto A, que puede cambiar de signo al per- 
mutar. las raíces, el discriminante D es simétrico con respecto a 
Qis a -s Un Y, por esto, se puede expresar mediante los coefi- 
cientes del polinomio f (x). Para hallar esta expresión, suponiendo 
que la característica del campo P es igual a cero, se puede utilizar 
la relación existente entre el discriminante del polinomio f (z) 
y la resultante de este polinomio y su derivada. Es natural esperar 
la existencia de tal relación, pues, como ya sabemos por el $ 49, 
un polinomio tiene raíces múltiples cuando, y sólo cuando, tiene 
raíces comunes con su derivada f’ (z), por lo cual, D = O cuando, 
y sólo cuando, R (f, f') = 0. 

Por la fórmula (3) del presente párrafo, se tiene: 


RG f)= ag ü ra). 


ando la igualdad 


Hina Ù, E— o), 
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resulta: 


Después de poner aquí œ; en lugar de z, todos los sumandos, 
a excepción del ¿-ósimo, se anulan, por lo cual, 


r =a [1 (u—a;), 
de donde 


Ri, Marta ll a). 


En este producto, para cualesquiera ¿ y j, ¿> j, figuran dos factores: 
A; — %y y 4 — Gi. El producto de éstos es igual a (—1)-(a, — a), 


y como existen 2479 


pares de índices i, j, que satisfacen a las 
i >j>41, resulta: 


desigualdades n 


RGF) 


Ejemplo. Hallemos el diseriminante del trinomio cuadrático 
1) att br 4e, 


Como 4” (x) = 2az-++b, so tiene, 


a be 
RG, f')=|2a b 0|=a(—b?--4ac). 
0 2ab 


n(n) 


En el caso considerado, =1, por lo cual, 


D 


ain (f, f)=0*— hac. 


Esto coincide con lo que en el 


si i Igebra escolar laman ordinariamente discri- 
minante de la ecuación cuadr, 


A. 


Otro método para hallar el discriminante consiste en lo siguiente. 
Formemos el determinante de Vandermonde de las potencias de las 
raices di, Qa, «> =1 On. Como se demostró en el $ 6, 
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y por esto, el discriminante es igual al cuadrado de este determinan- 


te multiplicado por «2-2, Multiplicando este determinante por su 
P a p! 


n de las matrices y recor- 
en el párrafo precedente, 


traspuesto según la regla de multipl 
dando las sumas de potencias, defi 
resulta; 


E E E 
$ S ë s Sn 
D=: agr- asy 


Sn- Sn 


donde s, es la suma de las k-ésimas potencias de las raices œj, a, + + 


ten An 
Ejemplo. Jallemos el discriminante del polinomio cúbico /(r) =x? 
last | be |e, Por (18), se tiene, 
3a hj 
Djs sasa |. 


LEEN 


Como ya sabemos por el párrafo anterior, 


s10 = =a, 
50-207 —al— 2b, 
sy 0—30109-1-309——a% ; 3ab—3e. 


Aplicando la fórmula do Newton, y ten 
también que 


sio] —4otoz + 401035203 a1—4a?b i-hac-| 202, 


do en cuenta que 04'=0, hallamos 


Do aquí, 

D 30984) 2s — sisisi — Do] = año? —4ba— hate -ABabo 27%. (19) 
En particular, siendo a=0, o sea, para el polinomio cúbico incompleto, 

resulta: 


D= —4b3— 27c, 
lo cual está en correspondencia con lo que se dijo en el $ 38. 


$ 55. Segunda demostración del teorema fundamental 
del álgebra de los números complejos 


La demostración del teorema fundamental, expuesta en el § 23, 
se efectuó de un modo no algebraico. Aquí queremos exponer otra 
demostración, en la que se emplea esencialmente el método alge- 
braico. Así, pues, se aplicará el teorema fundamental de los 
polinomios 'simétricos ($ 52), y también el teorema de la existen- 
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cia de un campo de descomposición para cualquier polinomio ($ 48). 
Por otra parte, la parte no algebraica de la demostración será mínima 
y se reducirá a una afirmación muy sencilla, 

Obsérvese primero que en el $ 23 se demostró el lema del 
módulo del término superior de un polinomio. Suponiendo que los 
coeficientes del polinomio f (z) son reales y poniendo k = 1, de 
este lema obtenemos el siguiente corolario 

Para valores reales de x suficientemente grandes en valor absoluto, 
el signo de un polinomio f (z) de coeficientes reales coincide con el 
signo de su término superior. 

De aquí se desprende el resultado siguiente: 

Un polinomio de grado impar, de coeficientes reales, tiene por lo 
menos una raíz real. 

En efecto, sea 


1(2) = aoz" 4- aa" Ham, 


donde todos los coeficientes son reales. Como n es impar, el término 
superior aoz", para valores positivos y negativos de z, tiene diferen- 
tes signos, por lo cual, como se ha demostrado más arriba, para 
valores positivos y negativos de z, suficientemente grandes en valor 
absoluto, el polinomio f (x) también tiene signos distintos. Por 
consiguiente, existen unos valores reales de x, por ejemplo, a y b, 
tales que 
1(a)<0, f) 0. 


Sin embargo, por el curso de análisis se sabe, que el polinomio f (x) 
(o sea, la función racional entera) es una función continua y, por 
esto, en virtud de una de las principales propiedades de las funcio- 
nes continuas, para ciertos valores reales de x comprendidos entre 
a y b, f (x) toma cualquier valor previamente asignado, intermedio 
entre f (a) y f (b). En particular, existe un œ, comprendido entre a y b, 
tal que f (æ) = 0. 

Basándonos en este resultado, demostrarem 
siguiente: 

Todo polinomio de coeficientes reales, de un grado arbitrario, tiene 
por lo menos una raíz compleja. 

En efecto, sea dado un polinomio f (z) de coeficientes reales y de 
grado n = 2%, donde q es un número impar. Como el caso k = O ya 
se ha estudiado antes, supondremos que k => 0, o sea, que n es un 
número par, y haremos la demostración por inducción Sobre Æ, supo- 
niendo que nuestra afirmación ya está demostrada para todos los 
polinomios de coeficientes reales, cuyos grados son divisibles por 2*- 
pero no son divisibles por 2%”. 


ahora la proposición 


neluso mayores que n. 


* Por consiguiente, estos grados pueden ser 
234 
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Sea P un campo de descomposición del polinomio f (z) sobre 
el campo de los números complejos (véase el $ 49) y sean dy, a, >> + 
+ + + tn las raíces de f (z) contenidas en el campo P. Tomemos 
un número real arbitrario c y consideremos los elementos del campo 
P que son de la forma 


Piy = aj 


clau), ic (1) 
Evidentemente, el número de elementos fij es igual a 


tq (2 — 
aA _ ge (2 =g, e) 


donde q' es un número impar. 
Formemos ahora un polinomio g (x) del anillo P |z] que tenga 
por raíces todos estos elementos Pi; y sólo éstos: 


ros, yet 


Los coeficientes de este polinomio son polinomios simétricos ele- 
mentales en Pj. Por consiguiente, en virtud de (1), son polinomios 
en i, %a, -s % de coeficientes reales (puesto que el número e 
es real) y, además, son simétricos. En efecto, la trasposición de 
cualesquiera dos æ, por ejemplo, de ær y œ, implica solamente 
una permutación en el sistema de todas las Bı; cualquiera fiaj, donde 
jes distinto de k y de 7, se convierte en Bı; y viceversa, mientras 
que Ba: y todas las Biy, para i y j diferentes de k y l, se quedan 
en el sitio. Mas, los coeficientes del polinomio g (z) no varían al 
permutar sus raíces. 

En virtud del teorema fundamental de los polinomios simé- 
tricos, de aquí se deduce que los coeficientes del polinomio g (z) 
son polinomios (de coeficientes reales) en los coeficientes del poli- 
nomio dado f(z) y, por esto, ellos mismos son números reales. 
El grado de este pi ual al número de las raíces Bij, en 
virtud de (2), es divisible por 2%, pero no lo es por 2". Por esto, 
por la hipótesis de la inducción, al menos una de las raíces fiiy del 
polinomio g (z) tiene que ser un número complejo. 

Por lo tanto, cualquiera que sea el número real elegido c, se 
puede indicar un par de índices ¿, j, donde 1 < i < n, 1 <j <n, 
de modo que el elemento 2%, + c (a: + a) sea un número com- 
plejo; recordemos, que el campo P contiene al campo de los núme- 
ros complejos como subcampo. Se entiende que, por lo general, 
para otra elección del número c, a éste le va a corresponder en el 
sentido indicado otro par de índices. Sin embargo, existe una infi- 
nidad de números reales e distintos, mientras que nosotros dis- 
ponemos solamente de un número finito de pares i, j distintos. 
De aquí se deduce, que se pueden elegir dos números reales distin- 
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tos c, y Ca, c, Æ cz, tales, que a éstos les corresponde un mismo 

par de índices, para los cuales, los números 
00-01 (i+ aj) =a, (3) 

00) ca (a+ a) =b 

son complejos. 

De la igualdad (3), resulta: 

(c1 — c) (0% +05) 

de donde se deduce que 


itaj 


e 


o sea, esta suma es un número complejo. De aquí, y si se quiere 
de la primera de las igualdades (3), se deduce que el producto 0%, 
también es un número complejo. Por lo tanto, resulta que los ele- 
mentos æ, y ay son raíces de la ecuación cuadrática 


2 (u +0)2+00,= 


de coeficientes complejos, por lo cual, como esto se deduce de la 
fórmula para la resolución de la ecuación cuadrática con coeficientes 
complejos, obtenida en el $ 38, ellos mismos tienen que ser números 
complejos. Por consiguiente, entre las raíces del polinomio f (£) 
hemos hallado incluso dos complejas, con lo cual queda demostrada 
nuestra afirmación. 

Para demostrar por completo el teorema fundamental, queda 
por considerar el caso de un polinomio de coeficientes complejos 
arbitrarios. Sea 


+ An 


Í (2) = aot" + axt 
un polinomio de este tipo. Consideremos el polinomio 


OET TTE + as 
obtenido de f(z) por sustitución de todos los coeficientes por sus 
conjugados, y examinemos el producto 


PS AFE) = a ban i o barta a H bon 
donde, evidentemente, 


h= Y aap k 
i+j=k 
Basándose en las propiedades de los números complejos conjugados, 
conocidas por el § 18, obtenemos que 


0, 4, 2, ..., 2n. 


b= Y naj= bn 
a 


o sea, todos los coeficientes del polinomio F (z) son números reales. 
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Como se ha demostrado más arriba, de aquí se deduce que el 
polinomio F (z) tiene por lo menos una raíz compleja f, 
FB) =1 18) (8) 0, 
o sea, o f($)=0, o bien, /(8)=0. En el primer caso, el teorema 
queda demostrado. Si es que se cumple el segundo caso, o sea, si 
ap apo... +2=0, 


entonces, sustituyendo todos los números que figuran aquí por sus 
conjugados (que, como ya sabemos, no infringe la igualdad), 
obtenemos: d 


Iata... +00, 
o sea, el número complejo P es de f(x). La demostración del 
teorema fundamental se ha terminado. 


CAPITULO XI 


POLINOMIOS 


DE COEFICIENTES RACIONALES 


$ 56. Keducibilidad de los polinomios sobre el campo 
de los números racionales 


EL tercer campo numérico que, junto con los campos de núme- 
ros reales y de números complejos tiene para nosotros un interés 
especial, es el campo de los números racionales; éste Jo designaremos 
mediante R. Entro todos los campos numéricos éste es el más pequeño, 
pues, como se demostró en el $ 43, el campo R está contenido total- 
mente en cualquier campo numérico. Ahora nos va a interesar el 
problema de la reducibilidad de los polinomios sobre el campo de 
números racionales y, en el siguiente párrafo, el problema de Jas 
raices racionales (enteras o fraccionarias) de los polinomios de 
cocficientes racionales. Subrayemos una vez más, que éstos son 
alos problemas distintos; por ejemplo, el polinomio 


zti 2a 4-1 = (4 1) 


es reducible sobre el campo de números racionales, a pesar de que 
no tiene ninguna raíz racional. 
Jué se puede decir de la reducibilidad de los polinomios 
sabre el campo R? Ante todo, obsérveso que, dado un polinomio 
f (2) de coeficientes racionales que no sean todos enteros, entonces, 
reduciendo éstos a un común denominador y multiplicando f (z) 
por este denominador, igual, por ejemplo, a k, resulta un polino- 
mio kf (z) cuyos coeficientes son ya números enteros. Es evidente, 
que los polinomios f (z) y kf (x) tienen raíces iguales; por otra parte, 
éstos son a la vez reducibles o irreducibles sobre el campo R. 
Mas, por ahora, no tenemos derecho de limitarnos a estudiar 
en adelante Jos polinomios de coeficientes enteros. En efecto, supon- 
gamos que el polinomio g (z) de coeficientes enteros es reducible 
sobre el campo de los números racionales, o sea, que se descompone 
en factores de menor grado de coeficientes racionales (en general, 
fraccionarios). ¿Se deduce de esto que g (z) se descompone en fac- 
tores de coeficientes enteros? En otras palabras, ¿puede ocurrir 
«que un polinomio de coeficientes enteros sea reducible sobre el 
campo de números racionales y sea irreducible sobre el anillo de 
los números enteros? 
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La respuesta a estas preguntas se puede obtener haciendo un 
exámen análogo al que se hizo en el § 51. Llamemos primitivo 
al polinomio f (z) de coeficientes enteros, si sus coeficientes son 
primos entre sí, o sea, si no tienen divisores comunes distintos de 
1 y —4. Cualquier polinomio p (2) de coeficientes racionales se 
puede representar de un modo único en forma de un producto de 
una fracción irreducible por un polinomio primitivo: 


+1) (1 


para esto hay que sacar fuera de paréntesis el común denominador 
de todos los coeficientes del polinomio y (2), y después, los factores 
comunes de los numeradores de estos coeficientes; obsérvese que el 
grado de f (2) es igual al grado de q (2). La unicidad (salvo el signo) 
de la representación (1) se demuestra del modo siguiente. Sea 


o()=F 1a) =F) 


e(z) 


donde g(x) es de nuevo un polinomio primitivo, Entonces, 
ad] (x) = beg (2). 


Por lo tanto, ad y be se han obtenido sacando todos los factores 
comunes de los coeficientes de un mismo polinomio de coeficientes 
enteros, por lo cual, pueden diferenciarse entre sí solamente en el 
signo. De aquí so deduce, que los polinomios primitivos f (2) y g (2) 
también pueden diferenciarse entre sí solamente en el signo. 

Para los polinomios primitivos de coeficientes enteros conserva 
su valor el¿lema de Gauss: 

El producto de dos polinomios primitivos de coeficientes enteros 
es un polinomio primitivo. 

En efecto, sean dados los polinomios primitivos de coeficientes 
enteros 


f(z) =ar" Haat- pn.. Rp, 
g0) = bor! ba't bati bi 


y sea 


Ha) g (2) = corta Cr ja VHD- UHD- 


eHe 
Si este producto no es primitivo, existe un número primo p que 
es común divisor de todos los coeficientes Co, C1, - - -, Cay: Como 
no todos los coeficientes del polinomio primitivo f (z) pueden 
dividirse por p, habrá uno, sea éste a;, que será el primero que no se 
divido por p; del mismo modo, sea 5; el primer coeficiente del poli- 
nomio g (x) que no se divide por p. Multiplicando término a término 
f (2) por g (z) y reuniendo los términos que contienen a Z0+0=649, 
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resulta: 

Cry = 0103 + imag roja > > + 41 Dy 1 + Aitab- H 
El primer miembro de esta igualdad se divide por p. Por éste se 
dividen también todos los términos del segundo miembro, menos 
el primero; en efecto, en virtud de las condiciones impuestas a la 
elección de i y j, todos los coeficientes 4-4, Qi-2, - - ., y también 
bj-s, bj-z - - +» Se dividen por p. De esto se deduce, que el pro- 
«ducto a;b; también se divide por p y, por esto, como p es un número- 
primo, tiene que dividirse por p por lo menos uno de los coeficientes 
ai, bj, lo cual, sin embargo, no es cierto. Con esto queda terminada 
la demostración del lema. 

Pasemos a responder a las preguntas que se hicieron más arriba. 
Supongamos que el polinomio g (x) de grado n, de coeficientes 
enteros, es reducible sobre el campo de números racionales: 


E(2)=91(2) Pa (2), 


donde qı(z) y qa(x) son polinomios de coeficientes racionales 
de grado menor que n. Entonces, 


ihla), i=1, 2, 


9 (2) 


donde t- es una fracción irreducible, f(z) es un polinomio pri- 
mitivo. "Por lo tanto, 
gws 


AGIAN 


EL primer miembro de esta igualdad es un polinomio de coeficientes 
enteros, por esto, el denominador b;bz del segundo miembro tiene 
que simplificarse. Mas, por el lema de Gauss, el polinomio que 
figura entre corchetes es primitivo, por lo tanto, cualquier factor 
primo de bb» puede simplificarse solamente con cierto factor primo 
de asa), y como a, y b; son primos entre sí, i = 1, 2, el número as 
tiene que dividirse por b, y el número a;, por bz: 


aba; a= baa 
al) = aiaifi (a) fala). 


Uniendo el coeficiente aja; a cualquiera de los factores f, (2), fa (2), 
obtenemos la descomposición del polinomio g (z) en factores de 
menor grado de coeficientes enteros. Con esto, queda demostrado 
el siguiente teorema: 

Un polinomio de coeficientes enteros que es irreducible sobre el 
anillo de los números enteros, es irreducible también sobre el campo 
de los números racionales. 


De aquí que 
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Por fin, hemos obtenido ahora el derecho de limitarnos a estu- 
diar las descomposiciones de los polinomios de coeficientes enteros 
en factores cuyos coeficientes también sean enteros, en las cuestio- 
nes relacionadas con la irreducibilidad de los polinomios sobre el 
campo de números racionales. 

Ya sabemos que sobre el campo de los números complejos, es 
reducible todo polinomio cuyo grado sea mayor que la unidad, y sobre 
el campo de los números reales, todo polinomio (de coeficientes 
reales) cuyo grado sea mayor que dos. Otra cosa ocurre en el caso 
del campo de los números racionales: para cualquier n se puede 
indicar un polinomio de n-ésimo grado de coeficientes racionales 
(e incluso enteros) que es irreducible sobre el campo de los números 
racionales. La demostración de esta afirmación se basa en el siguiente 
criterio suficiente de irredu idad de un polinomio sobre el 
campo R, denominado e: : 

Sea dado un polinomio 


12) = at" ar 


de coeficientes enteros. Si, al menos de un modo, se puede elegir 
un número primo p que satisfaga a las condiciones siguientes: 

1) el coeficiente superior ay no es divisible por p, 

2) todos los demás coeficientes son divisibles por p, 

3) el término independiente, siendo divisible por p, no es divisible 
por p°, entonces el polinomio f (x) es irreducible sobre el campo de 
los números racionales, 

En efecto, si el polinomio f (z) es reducible sobre el campo R 
entonces se descompone en dos factores de menor grado de coefi- 
cientes enteros: 


12) = (by dat e... + bn) (Cox! +- caz! e.e +6), 


donde k<n, l<n, =n. Identificando los coeficientes de 
ambos miembros de esta igualdad, obtenemos: 


i- an-3® + an, 


an= brer, 
an-s = br€t-1 + Dato 
bret- + br-16t-1 


2) 


De la primera de las igualdades (2) se deduce que, como a, es 
divisible por p y el número p es primo, uno de los factores bj, Cy 
tiene que ser divisible por p. Ambos no pueden ser divisibles por p, 
puesto que, por la hipótesis, a, no es divisible por p?. Supongamos, 
por ejemplo, que b, es divisible por p y, por lo tanto, c, es primo 
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con p. Examinemos ahora la segunda de las igualdades (2). Su pri- 
mer miembro, y también el primer término del segundo miembro, 
son divisibles por p, por lo cual, el producto b,—:c; también es 
divisible por p; pero como e, no es divisible por p, tiene que ser 
divisible por p el número bj_,. De un modo semejante, de la tercera 
de Jas igualdades (2), resulta que b_2 es divisible por p, ete. Por 
fin, de la (k + 1)-ésima igualdad resultará que by es divisible por p; 
pero entonces, de la última de las igualdades (2) se deduce que ag 
es divisible por p, lo cual contradice a la hipótes 

Para cualquer n es muy fácil escribir polinomios de coeficientes 
enteros de n-ésimo grado que satisfagan a las condiciones del 
criterio de Eisenstein y, por lo tanto, que sean irreducibles sobre 
el campo de los números racionales. Tal es, por ejemplo, el polino- 
mio z” > 2; a éste es aplicable el criterio de Eisenstein para p = 2. 

El criterio de Eisenstein es solamente una condición suficiente 
de irreducibilidad sobre el campo R, pero no es una condición nece- 
saria: puede ocurrir que, para un polinomio dado f (x), no se pueda 
elegir un número primo p, de modo que se cumplan las condiciones 
del criterio de Eisenstein, siendo el polinomio reducible como, por 
ejemplo, z? — 5z -+ 6, o irreducible, como z? -+ 4. Además del 
criterio de Eisenstein existen muchos más criterios suficientes 
distintos de irreducibilidad de los polinomios sobre el campo R que, 
por cierto, son menos importantes. Existe también un método que 
pertenece a Kronecker, que permite responder para cualquier 
polinomio de coeficientes enteros si éste es reducible o no lo es 
sobre el campo R, Mas, este método es muy complicado y casi no 
tiene aplicación práctica. 


'mplo. Examinemos el polinomio 


1 
tt 
donde p es un número primo. Son raíces do esto polinomio las raíces p-ésimas de 
la unidad, distintas do la unidad misma; como estas raíces, junto con la unidad, 
dividen al círculo unidad del campo complejo en p partes iguales, el polinomio 
fp (2) se llama polinomio de división del círculo. 

A esto polinomio no se le puedo aplicar directamente el criterio do Eisens- 
tein; Mas, hagamos una sustitución do la indeterminada, poniendo z = y + 
—4. Resulta: 


L(0=1p 04 0= 


A ES 


CA 
y—1) 


pi 
¿[ws pura pg pe pe »] e 


Los coeficientes de polinomio g (y) son los números binomiales y, por esto, todos, 
menos el superior, son divisibles por p; el término independiente no es divisible 
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por p?. Por lo tanto, según el criterio de Eisenstein el polinomio g (y) es irre- 
duciblo sobre el campo Æ. De aquí se deduce la ¿rreducibilidad sobre el cam- 
po R del polinomio de división del circulo fp (2). En electo, si 


f= (Y 60, 
Dv (ui 1D. 


$ 57. Raíces racionales de los polinomios 
de coeficientes enteros 


entonces 


¿m=-0wu 


s arriba se señaló, que el problema de la descomposición 
de un polinomio dado en factores irreducibles sobre el campo de los 
números racionales no tiene prácticamente una solución más o menos 
satisfactoria, Pero un caso particular de este problema, referente 
a la separación de los factores lineales de un polinomio de coefi- 
cientes racionales, o sea, a la averiguación de sus raíces racionales, 
es muy elemental y se resuelve sin recurrir a cálculos complicados, 
Es comprensible que, con el problema de Ja averignación de Jas 
raíces racionales de los polinomios de coeficientes racionales no se 
agota de ningún modo el problema general de las raíces reales de 
estos polinomios, es decir, que los métodos y resultados expuestos 
en el capítulo noveno conservan también enteramente su valor para 
los polinomios de coeficientes racionales. 

Empezando a resolver el problema de la averiguación de las 
raíces racionales de los polinomios de coeficientes racionales, seña- 
lemos que, como se había indicado en el párrafo anterior, podemos 
limitarnos a estudiar solamente los polinomios de coeficientes 
enteros; además, se van a examinar por separado los casos de raíces 
enteras y de raíces fraccionarias. 

Si el número entero œ es raíz del polinomio f (x) de coeficientes 
enteros, œ es divisor del término independiente de este polinomio. 

En efecto, sea 


(8) = apa" + aa 4- 0 o Pap. 
Dividamos f(x) por z— a: 
$ (2) = (x—a) (barnt -4 birh? -i |.. e bn-1). 


Efectuando la división por el método de Horner, expuesto en 
el § 22, obtenemos que todos los coeficientes del cociente, incluyendo 
también by, son números enteros, y como 

an = — abn- = a (— bni), 
nuestra proposición queda demostrada *. 


* Sería erróneo demostrar esto teorema alegando al hecho de que el térmi- 
mo independiente a es el producto (salvo el signo) de todas las raíces del poli- 
nomio f (z), pues, entre éstas puedo haber también fraccionarias, irracionales 
y complejas, debido a lo cual, no se puede afirmar por anticipado que el pro- 
ducto de todas estas raíces, a excepción de a, es un número entero. 
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Por lo tanto, si un polinomio f (z) de coeficientes enteros tiene 
raíces enteras, éstas se hallan entre los divisores del término inde- 
pendiente. Por consiguiente, se deben ensayar todos los divisores 
posibles del término independiente, tanto los positivos como los 
negativos; si ninguno de éstos es raíz del polinomio, este último 
carece en general de raíces. 

Puede ocurrir que el ensayo de todos los divisores del término 
independiente sea muy engorroso, incluso cuando los valores del 
polinomio se calculen por el método de Horner en vez de sustituir 
directamente cada uno de los divisores en lugar de la indeterminada. 
Las observaciones que se hacen a continuación permiten simplificar 
un poco estos cálculos. Como 1y—1 siempre son divisores del 
término independiente, se calculan en primer lugar f (1) y f (4), 
lo cual no ofrece dificultad alguna. Si, luego, el número entero œ 
es raíz de f (2): 

Fx) = (+0) (1), 
como se indicó más arriba, todos los coeficientes del cociente 
q (+) son números enteros y, por esto, los cocientes 


i LU» 
a ID Fa 


=—4(—1) 


tienen que ser números enteros. Por lo tanto, solamente tienen que 
ensayarse los divisores a del término independiente (distintos de 4 y —1) 


para los cuales cada uno de los cocientes 18, EED es un número 


entero. 
Ejmplos. 1. Hallar las raíces enteras del polinomio 
1(2) 


del término independiente sor 
= —8, los números í y —1 no 


3, +6. Como 
Por otra parto, 


103 númoros 


son fraccionarios, por lo cual, los divisores 2, —2, 6, —6 tienen que ser dese- 
chados, mientras que los números 


8 8 

3—1 3 
son enteros, y por esto, los d 
Apliquemos el método do Horn: 


-3 
o sea, f (—3)=—48 y, por esto, —3 no es raíz de f (z). Finalmente, 
12-16 

4 E o* 
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o sea, f (3)—0: el número 3 es de f(x). A la vez, hemos hallado los 
coeficientes del cociente de la división de f(r) por 1—3; 


j= 3 a? r 


Fácilmente se observa que el número 3 no es raíz del cociente 224 z+ 2, 
o sea, este número no es raíz múltiple de j (2) 

2. Hallar las raíces e a ag polino 

ta)= 2 

Aquí, los divisores del término indepen som =4 y 2, Por otra 
parto, Ji) = —L (=D = 1, o sea, 1 y —f no son raices. Finalmente, como 
los: números 

1 
1 

son fraccionarios, los números 2 y —2 tampoco serán raíces, por lo cual, el poli- 


nomio / (x) carece de raices enteras. 
Examinemos el problema de las raíces fraccionarias. 


Si un polinomio de coeficientes enteros, cuyo coeficiente superior 
es igual a la unidad, tiene una raíz racional, ésta es un número entero. 


En efecto, supongamos que la fracción irreducible + es raíz del 
polinomio 


t= a" 


enteros, o sea, que 


E ast"? | a.. ian 


de coeficiente: 


De aquí, resulta la igualdad 
on P 
E Lab — agb to... anc"! 
es decir, que una fracción irreducible es igual a un número entero, 
lo cual es imposible, 
Para obtener todas las raíces racionales (enteras o fraccionarias) 
de un polinomio de coeficientes enteros 


J (2) = aox" + aja 
hay que hallar todas las raices enteras del polinomio 
q (y) = y" + asy"! + aoaay"™ 
y dividirlas por ag. 
En efecto, multipliquemos f(z) por az=!, y hagamos después 
la sustitución de la indeterminada poniendo y = aor, Evidente- 
mente, 


Pd e 


+ T ap anay F ag tan 


(y) =p (a02) =a% (0). 


De aquí se deduce, que las raíces del polinomio f (£) son iguales 
a las_raíces del polinomio q (y), divididas por ay. En particular, 
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a las raíces racionales de f(x) corresponderán raíces racionales 
de e (y); pero, como el coeficiente superior de q (y) es igual a la 
unidad, estas raíces sólo pueden ser enteras, y ya tenemos un método 
para buscarlas. 
Ejemplo. Hallar las raises racionales del polinomio 
10) 378 2529 
Multiplicando j (z) por 33 y poniendo y-=3z, obtenemos: 
qayt 5y? i 3y? i 
Buscamos las raíces enteras del polinomio q (y) 
Por el método de Horner, hallamos q (1): 


mbr. 


=m. 


1169m 0 


Por la tanto, p (1) 0, o sea, 1 es una raíz de q (y), siendo 


y= u1) q Uh 
donde 
a) u? 6y? i 9y 54 


Hallemos las raices enteras del polinomio q (y). Los divisores del térmi 
independiente son: LL, 3, =6, +9 b18, 0:27 Aquí 


att) 70, g(—1)= 50. 


Calculando 4 y LD para cada divisor de a, se observa, que se 


tienen que desechar todos los divisores menos a— 6. ayamos este 
divisor: 

16954 

109 0’ 


Por lo tanto, q (—6) — 0, o sea, —6 es raíz do q (y) y, por esto, de q (y) 
Por consiguiente, el polinomio q (y) tiene las raíces enteras 1 y —6. 


p i 1 A 
las raíces racionales del polinomio / (z) son los números y —2, y sólo éstos. 


Es menester subrayar una vez más, que los métodos expuestos 
anteriormente solamente se pueden aplicar a los polinomios de 
coelicientes enteros y sólo para hallar sus raíces racionales. 
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Todo polinomio de grado n de coeficientes racionales tiene n 
raices en el campo de los números complejos, algunas de las cuales 
(e incluso todas) pueden estar fuera del campo de los números 
racionales. Mas, no cualquier número real o complejo es raíz de 
algún polinomio de coeficientes racionales. Los números complejos 
(y, en particular, los números reales) que son raíces de tales polino- 
mios, se llaman números algebraicos, en contraposición a los números 
trascendentes. Entre los números algebraicos figuran los números 
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racionales, como raíces de los polinomios de primer grado de coefi- 
cientes racionales, y también cualquier radical de la forma Y) 
siendo el subradical a un número racional, pues es raíz del binomio 
a” — a, Por otra parte, en los cursos completos de análisis mate- 
mático se demuestra que es trascendente el número e, base del 
sistema de los logaritmos naturales, y también el número 7, bien 
conocido en la geometría elemental. 

Si el número a es algebraico, éste será incluso raíz de un poli- 
nomio de coeficientes enteros y, por esto, será raiz de uno de los 
divisores irreducibles de este polinomio, que también es de coefi- 
cientes enteros. El polinomio irreducible de coeficientes enteros que 
tiene por raíz al número æ se determina univocamente, salvo un factor 
constante, o sea, de un modo único en absoluto, si se exige que los coefi- 
cientos de este polinomio sean primos entre sí (es decir, que el polinomio 
sea primitivo). En efecto, si œ es una raíz de dos polinomios irre- 
ducibles f (z) y g (x), el máximo común divisor de éstos tiene que 
ser distinto de la unidad, por lo cual, en virtud de su irreducibilidad, 
estos polinomios pueden diferenciarse entre sí solamente en un 
factor de grado cero. 

Los números algebraicos que son raíces de un mismo polinomio 
irreducible (sobre el campo R), se llaman conjugados entre sí*. 
Por consiguiente, todo el conjunto de números algebraicos se des- 
compone en clases finitas disjuntas de números conjugados entre sí. 
Todo número racional, como raíz de un polinomio de primer grado, 
no tiene números conjugados distintos de sí mismo, siendo ésta una 
característica de los números racionales. En efecto, todo número 
algebraico que no sea racional será raíz de un polinomio irreducible 
de grado mayor que la unidad, por lo cual, tendrá algún conjugado 
distinto de sí mismo. 

El conjunto de todos los números algebraicos es un subcampo del 
campo de los números complejos. En otras palabras, la suma, dife- 
rencia, producto y cociente de números algebraicos son también números 
algebraicos. 

En efecto, supongamos que se han dado los números algebraicos 
a y P. Designemos mediante a, = æ, %a, . . ., Œn, todos los números 
conjugados con a; mediante B, = P, Ba, . . ., Bas todos los números 
conjugados con PB; mediante f (x) y g (z), los polinomios irreducibles 
de coeficientes racionales que tienen por raíces los números a y B, 
respectivamente. Escribamos un polinomio cuyas raíces sean todas 
las sumas posibles æ; +- Br éste es 


v= Ù [| tz— (+B. 


= ja 


* No se debo confundir este concepto con el de números complejos con- 
jugados. 


$ 58. Los números algebraicos 369 


Evidentemente, los coeficientes de este polinomio no varían al 
permutar entre sí todas las a,, y también al permutar entre sí todas 
las Bj. Por consiguiente, según el teorema de los polinomios que 
son simétricos con respecto a dos sistemas de indeterminadas (véase 
el final del $ 53), estos coeficientes son polinomios en los coeficientes 
de los polinomios f (z) y g (z). En otras palabras, resulta que los 
coeficientes del polinomio q (z) son números racionales, por lo cual, 


el número æ -+ $ = æ, > Bs, al ser una de sus raíces, es un número 
algebraico. 


Del mismo modo, mediante los polinomios 


+e)= i i Iz — (e — B3) 


z=] I| -aB 
= jet 
se demuestra que los números æ — $ y aß son algebraicos. 

Para demostrar que el cociente de dos números algebraicos es 
un número algebraico, es suficiente demostrar que, si el número æ 
es algebraico y distinto de cero, entonces, el número a”! también 
lo es. Sea œ raíz del polinomio 


f (2) =4p1" 40217... Ap ¡7 F an 
de coeficientes racionales. Entonces 


, evidentemente, el polinomio 


g (1) = ant" + an1"! . 44, 
g s 1 


que también es de coeficientes racionales, tiene la raiz a™, como 
se quería demostrar. 

Del teorema que acabamos de demostrar se deduce, que cualquier 
suma de un número racional y un radical, por ejemplo, Vz, 
y también cualquier suma de radicales, por ejemplo, V3 + (/5, 
son números algebraicos. Mas, por ahora, no podemos afirmar que 
son algebraicos los números que se escriben en forma de radicales 
«de dos pisos», por ejemplo, 1-4 y 
mente del siguiente teorema: 

Si el número w es raíz del polinomio 


q (r) =x" Har" pa" 


2. Esto se va a deducir sola- 


spiri 
cuyos coeficientes son números algebraicos, entonces, w es también un 
número algebraico. 

Supongamos que æi, Bj, ..., As, pg toman todos los valores 
conjugados con los númerosa, $, . . ., à, u, siendo a, =æ, B=, . 
<.. Äi = A, p > p. Consideremos todos los polinomios posibles 
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de la forma: 
A 


de modo que 4, 4, 
todos estos polinomio: 


F()= 


A Rati Me 


(2) =q (2), y tomemos el producto de 


Mood: 


Evidentemente, los coeficientes del polinomio £ (x) son simétricos 
con respecto a cada uno de los sistemas %;, Bj, -.-., As, He, por lo 
cual, (de nuevo en virtud del teorema del $ 53), éstos son polino- 
mios en los coeficientes de aquellos polinomios irreducibles (de 
coeficientes racionales) cuyas raices son æ, P, . . ., A, p, respectiva- 
mente, o sea, ellos mismos son números racionales. Por consiguiente, 
el número w, siendo raíz de q (z), es también raíz del polinomio 
F (æ) de coeficientes racionales, es decir, es un número algebraico. 


V2. En virtud 


del teorema anterior, el número æ = 1 + VZ es algebraico y, por 
esto, el número œ es raíz del polinomio z* — æ, de coeficientes 
algebraicos, o sea, el mismo es algebraico. En general, reiterando 
los dos teoremas que acabamos de demostrar, el lector obtendrá 
sin dificultad alguna el siguiente resultado: 

Todo número que se expresa por radicales sobre el campo de números 
racionales (es decir, que se expresa por una combinación de radicales, 
lo más complicada que sea, y en el caso general, por radicales «de 
muchos pisos»), es un número algebraico. 

Evidentemente, los números algebraicos que se expresan por 
radicales forman un campo. Pero hay que tener presente que, como 
esto se deduce de la observación que se hizo (sin demostración) al 
final del $ 38, éste es solamente una parte del campo de todos los 
números algebraicos. 


Apliquemos este teorema al número œ = Y/ 1 


Antes ya so había señalado que los números e y z son trascendentes, Pero, 
en la realidad, hay una infinidad de números trascendentes. Además, aplicando 
los conceptos y métodos de la teoría de los conjuntos, domostrarenios que, en 
cierto sentido, hay más números trascendentes que algebraicos; el significado 
exacto de esta expresión quedará claro a continuación. 

Un conjunto infinito M se lama numerable, si éste puede ponerse en corres- 
pondencia biunivoca con el conjunto de los números naturales, o sea, si sus ele- 
Mentos se pueden numerar mediante los números naturales, y no numerable, 
en caso contrario. 

Lema 1. Todo conjunto infinito M contiene un subconjunto numerable. 

En efecto, tomemos en M un elemento arbitrario as. Elijamos después un 
elemento a», distinto de a. En general, supongamos que ya so han elegido n ele- 
mentos distintos en M: ay, az, ... ap. Como el conjunto M es infinito, éste no 
puede agotarse con los elementos elegidos, por lo cual, se puede indicar otro 
Elemento a, ex; distinto de éstos. Continuando este proceso, hallaremos en M um 
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subconjunto infinito formado por los elementos 


as, da, 


es evidente que este subconjunto es numerable. 

Lema 2. Todo subconjunto infinito B de un conjunto numerable A, 
es numerable. 

Como el conjunto A es numerable, éste se puede escribir en la forma: 


rh (m 
Sea ar, el primer elemento de in 11) perteneciente a B; sea ay, el segundo 
elemento que tiene la misma propiedad, ete. Poniendo ar, = bh, n = 1, 2, 
obtenemos que los elementos del subconjunto B forman una sucesión, 


A APEN 


o soa, esto subconjunto es numerable. 

Loma 3. La unión de un conjunto numerable de conjuntos finitos que 
no tienen elementos comunes, es un conjunto numerable. 

En ofceto, sean dados los conjuntos finitos 


Ary Aga << ly 


y sea B la unión de ellos. Está claro que quedan numerados todos las elementos 
del conjunto 2, si do un modo arbitrario se numeran los elementos del conjunto 
finito Ay, y después se, continúa esta mumeración pasando a considerar los ele- 
mentos del conjunto Aa, ete. 

Lema 4. La unión de dos conjuntos numerables que no tienen elementos 
comunes, es un conjunto numerable. 

Sean dados los conjuntos mm 


ables A con los elementos 


E Op + 


y R con los elementos 
by bar 


in de estos conjuntos 


DS 


y sea C la um so 


A A 


dos los elementos del conjunto € quedarán representados en forma de la 
¡cesión 


Ci êz 


ar finat Cams es 
lo quo demuestra que esto conjunto es numerable. 
Demostremos ahora el siguiente teorem: 
El conjunto de todos los números algebraicos es numerable. 
Demostremas previamente que es numerable el conjunto de tados los polino- 
mios en una indeterminada de coeficientes enteros. Si 


J= aoza i... Fanit] an 


es un polinomio de éstos, distinto de cero, llamaremos altura del polinomio 
al número natural 

Mya lao li all ¿lana bb le 
Es evidente, que existe solamente un número finito de polinomios de coeficien- 
tes enteros de una altura dada A; designemos este conjunto mediante Mp. Desig- 
nemos también con Me el conjunto formado por el cero solamente. El conjunto 
de todos los polinomios de coel tes enteros es la unión del conjunto numera- 


hle de los conjuntos finitos Mo, Mi, Ma, ---, Mhs -~ 0 sea, en virtud del lema 3, 
es numerable. 
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De aquí, por el lema 2, se deduce que el conjunto de todos los polinomios 
primitivos irreducioles de coeficientes enteros también es numeradle. Por otra 
parto, ya sabemos que todo número algebraico es raíz de un polinomio primitivo 
irreducible de coeficientes enteros y solamente de uno. Por consiguiente, re 
niendo las raíces de todos los polinomios de esto tipo, o sea, tomando la unión 
de un conjunto numerable do conjuntos finitos, obtenemos el conjunto de todos 
los números algebraicos; por lo tanto, en virtud del lema 3, este conjunto es 
numerable. 

Finalmente, demostremos el teorem: 

El conjunto de todos los números trascendentes no es numerable. 

Examínemos primero el conjunto F de todos los números reales x, situados 
entre el cero y la unidad, O < z < 1, y demostremos que este conjunto no es 
numerable, Es sabido, quo cada uno de los números indicados z se puede expre- 
sar en forma de una fracción decimal propia infinita 

2=0, ats >> Mc. 
y, Quo esta expresión es única, si no se permiten fracciones en las quo, para todos 
los n, empezando desde cierto n todos los æn = 9; recíprocamente, cual- 
quior fracción do la forma indicada es igual a cierto número z de este conjunto 
F. Supongamos ahora que el conjunto Æ es numerable, o sea, que todos los 
números z se pueden escribir en forma de una suces 
Abr 82) 


Zis da 


Sea 
Zn 0, Apang 00 Ahn 


la expresión del número z, en forma de fracción decimal infinita. 
ahora una fracción decimal infinita 


O, Piña + Bn. 0) 


de modo que la cifra B, sea distinta de la primera cifra decimal de la fracción 
Zi 0 soa, Pa 7 œ, que la cifra Ba sea distinta de la segunda cifra decimal de 
la fracción za, o soa; fa g daa, y: om general, que Gn + Sna. Supongamos ade- 
más que entre las cifras Ba hay una infinidad de elfas, distintas de la cifra 9. 
Está claro que existe una fracción E que satisface a todas estas condiciones. 
Por consiguiente, ésta es un número del conjunto F y, por la construcción misma, 
es distinta de todos los números de la sucesión (2). Esta contradicción muestra 
quo el conjunto /' no es numerable. 

De aquí so deduce, que el conjunto de todos los números complejos no es 
numerable, pues, en caso contrario, en virtud del lema 2, éste no podría conte- 
ner el subconjunto no numerable F. En virtud del lema 4, os evidente ahora que 
no es numerable el conjunto de todos los números trascendentes, pues, la unión 
de este conjunto con el conjunto numerable de todos los números algebraicos es 
el conjunto de todos los números complejos, o sea, no es numerable. 

En virtud del lema 1, los dos teoremas que hemos demostrado muestran que, 
en la realidad, el conjunto de los números trascendentes es más rico en elemen- 
tos, o sea, es más «potentes que el conjunto de los números algebraicos. 


CAPITULO XIN 
FORMA NORMAL DE UNA MATRIZ 
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Aquí volvemos a examinar otra vez algunas cuestiones relaciona- 
das con el álgebra lineal. Al estudiar el capítulo 7, el lector ya se 
habrá convencido del papel importante que desempeña el concepto 
de semejanza de las matrices, Precisando, dos matrices cuadradas 
de orden n son semejantes cuando, y sólo cuando, determinan (en 
bases diversas) una misma transformación lineal del espacio lineal 
de n dimensiones. Sin embargo, por ahora, no sabemos contestar 
a la pregunta, si son semejantes o no dos matrices determinadas. 
Por otra parte, no sabemos hallar, por ahora, entre todas las matri- 
ces semejantes a la matriz dada A, la que, en tal o cual sentido, 
tiene la forma más simple; incluso la cuestión sobre las condiciones 
para que una matriz A sea semejante a una matriz diagonal, fue 
estudiada en el $ 33 solamente para un caso particular, Precisamente 
estas cuestiones se van a estudiar en el presente capítulo, y además, 
para el caso de un campo fundamental P arbitrario. 

Ocupémonos primero del estudio de las matrices cuadradas de 
orden n, cuyos elementos son polinomios de grados arbitrarios en 
una indeterminada À con coeficientes del campo P. Tales matrices 
so llaman matrices polinomiales o, abreviadamente, A-matrices. Es un 
ejemplo de 2-matriz la matriz característica A — AE de una matriz 
cuadrada arbitraria A con elementos del campo en la diagonal 
principal de esta matriz figuran polinomios de primer grado; fuera 
de la diagonal principal, polinomios de grado cero o ceros. Cualquier 
matriz con elementos del campo P (para abreviar, a tales matrices 
las llamaremos numéricas) también será un caso particular de 
las à-matrices: sus elementos son polinomios de grado cero, o son 
iguales a cero. 

Sea dada una A-matriz 


as (À) ~- ain 0) 


A(A) = 
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emos transformaciones elementales de esta matriz a las transfor- 
maciones de los cuatro tipos siguiente 

1) multiplicación de cualquier fila de la matriz A (4) por cual- 
quier número æ del campo P, distinto de cero; 

2) multiplicación de cualquier colbumna de la matriz A (A) por 
cualquier número æ del campo P, distinto de cero; 

n a cualquier ¿ósima fila de la matriz A (A) una 

Pésima fila cualquiera, jÆ i, y multiplicada por cual- 
quier polinomio q (4) del anillo P[ 
gregación a cualquier ¿ olumna de la matriz A KOJ 
ima colunma cualquiera. ji. y además, multipl 
cualquier polinomio q (2) del anillo PL 

Fácilmente se observa que, para cada una de las transformaciones 
elementales de una b-matriz, existe la transformación inversa, que 
también es elemental. Así, pues, para la transformación 4), la inversa 
es la transformación elemental que consiste en multiplicar la misma 
fila por el número a, que existe en virtud de la condición a + 
para la transformación 3), la inversa es la transformación que con- 
siste en agregar a la ò fila la j-ésima fila, multiplicada por 
—y (2). 

Efectuando unas cuantas transformaciones elementales en una 
matriz A (2), se pueden permutar dos filas o dos columnas cualesquier 

Supongamos, por ejemplo, que se necesita permutar la iésima 
y la jésima filas de la matriz A (2). Como muestra el esquema que 
esto se realiza efectuando cuatro transformaciones elemen: 


Jl 7 >> $ )=( 

Ú i 1 Ni y 

Aquí se ejecutaron las siguientes t aciones: a) a la ¿ésima 
fila se le agregó la j-ésima; b) de la j-ésima fila se restó la nueva 
i-ésima; e) a la nueva i-ésima fila se le agregó la nueva j-ésima; 
d) la nueva j-ésima fila se multiplicó por —1. 

Diremos que las }-matrices A Po) y B (2) son equivalentes, lo cual 
escribiremos con la notación A (2) — B (A), si se puode pasar de 
la matriz A (A) a la matriz B (A) efectuando un número finito de 
transformaciones elementales. evidente que esta relación de 
equivalencia es reflexiva, transitiva Y también simétrica, en virtud 
de la existencia de la transformación elemental inversa para cual- 
quier transformación elemental. En otras palabras, todas las A-matri- 
ces cuadradas de orden n sobre el campo P se descomponen en clases 
disjuntas de matrices equivalentes. 

Nuestro objetivo próximo consiste en buscar, entre todas las 
d-matrices equivalentes a una matriz dada A (2), una matriz que sea 
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lo más simple posible. Para esto, introduciremos el concepto siguien- 
te. Se llama A-matriz canónica a una A-matriz que posea las tres 
propiedades siguientes 

a) esta matriz es diagonal, o sea, tiene la forma siguiente 


e 0) o 
e) ; 
> 1) 


o 02 0) 


b) cualquier polinomio e; (A), i = 2, 3, ..., n, es divisible 
por el polinomio e;-4 (À); 

c) el coeficiente superior de cada polinomio e; (A), i © 4, 2... 
+, ny es igual a la unidad, si el polinomio es distinto de cero. 

Obsérvese que, si entre los polinomios e; (2) que figuran en la 
diagonal principal de la ¿-matriz canónica (1), hay algunos iguales 
a cero, entonces, en virtud de la propiedad b), éstos inevitablemente 
upan los últimos sitios en la diagonal principal. Por otra parte, 
si entre los polinomios e; (2) hay algunos de grado cero, entonces, 
según la propiedad c), éstos son todos iguales a 1 y, en virtud de la 
propiedad b), ocupan los primeros sitios en la diagonal principal 
de la matriz (1). 

En ticular, algu matrices numéricas, como la matriz 
unidad y la matriz cero, son también A-matrices canónica 

Toda d=matriz es equivalente a una 2-matriz canónica, o sea, en 
otras palabras, mediante transformaciones elementales se reduce a la 
forma canónica. 

Demostraremos este teorema por inducción sobre el orden n de 
las A-matrices consideradas. En efecto, para n =- 1, se tiene: 


A0)=(0(). 


Si a (2) = 0, nuestra matriz ya es canónica. Si a (0) + 0, es sufi- 
ciente dividir el polinomio a (2) por su coeficiente superior —esto 
es una transformación elemental de la matriz— y obtenemos una 
matriz canónica. 

Supongamos que el teorema ya está demostrado para las 2-matri- 
ces de orden z — 1. Examinemos una A-matriz arbitraria A (2) 
de orden n. Si ésta es igual a cero, entonces ya es canónica y no hay 
nada que demostrar. Por esto, supondremos que entre los elementos 
de la matriz A (4) hay algunos distintos de cero. 

Cambiando las filas de la matriz A (2) por columnas, si esto 
fuese necesario, se puede trasladar al ángulo superior de la izquierda 
uno de sus elementos distinto de cero. Por lo tanto, entre las A-matri- 
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ces que son equivalentes a la matriz A (A), hay algunas en cuyos 
ángulos superiores de la izquierda figuran polinomios distintos 
de cero. Consideremos todas estas matrices. Los polinomios que 
figuran en el ángulo superior de la izquierda de estas matrices pueden 
tener grado distinto. Pero el grado de un polinomio es un número 
natural, y en cualquier conjunto de números naturales, no vacío. 

viste el número menor. Por consiguiente, entre todas las A-matrices 
que son equivalentes a la matriz A (ìà) y que tienen en el ángulo 
superior de la izquierda un elemento distinto de cero, se puedo hallar 
una tal, que el polinomio que figure en dicho ángulo tenga el menor 
grado posible. Finalmente, dividiendo la primera fila de esta 
matriz por el coeficiente superior del polinomio indicado, obtenemos 
una A-matriz equivalente a la matriz A (2), 


es (A) bia (è) + Din O) 


a= bo (À) bas (À) --- ban (A) ; 


b À) ba (A 


on la que e, (2) +0, el coeficiente superior de este polinomio es 
igual a 1 y con ninguna combinación de transformaciones elementales 
o puede pasar de la matriz obtenida a una matriz en cuyo ángulo 
superior de la izquierda figure un polinomio de grado menor, distinto 

cero. 

Demostremos que todos los elementos de la primera fila y de la 
primera columna de la matriz obtenida son divisibles por e, (). Supon- 
gamos, por ejemplo, que, para 2 ù, 


by A= e0) rO, 


donde el grado de r (A) es menor que el grado de e, (A), si r (2) es 
diferente de cero. Entonces, restando de la j-ésima columna de 
nuestra matriz su primera columna, multiplicada por q (A), y per- 
mutando después la primera y j-ésima columnas, llegaremos a obte- 
ner una matriz equivalente a la matriz A (A), en cuyo ángulo supe- 
rior de la izquierda figurará el polinomio r (4), o sea, un polinomio 
de grado menor que e, (À), lo cual contradice a la elección de este 
polinomio. De aquí se deduce que r (2) = 0, como se quería demos- 
trar, 

Restando ahora de la j-ésima columna de nuestra matriz su 
primera columna multiplicada por q (à), se sustituye el elemento 
biy (A) por cero. Realizando tales transformaciones para j = 2, 3, . . 
. <- R, se sustituyen por ceros todos los elementos b,j (2). De un 
modo análogo, se sustituyen también por ceros todos los elementos 
bx (A), ¿=2, 3, ..., n. Por consiguiente, obtendremos una matriz 
equivalente A (à) en cuyo ángulo superior de la izquierda figurará 
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el polinomio e; (à) y en la que todos los demás elementos de la primera 
fila y de la primera columna serán iguales a cero: 
e) 0... 0 

O cal) >> Can A) 


O cnal) >> Cnn (À) 


Por la hipótesis de inducción, la matriz de (n — 1)-ésimo orden 
que figura en el ángulo inferior de la derecha de la matriz obteni- 
da (2), mediante transformaciones elementales se reduce a la forma 


canónica: 
B + Can 4 
Ena (À) >>. Can (A) ` 
Nee o an0 
Efectuando las mismas transformaciones con las filas y columnas 
correspondientes de la matriz (2) —evidentemente, en este caso 


la primera fila y la primera columna de esta matriz se quedan 
invariables —, obtenemos que 


es (À) D 
ea (Q) 
ao~ a ; (3) 


AMN= a 


e2 (0) 0 


o e 


Para demostrar que la matriz (3) es canónica no queda más que 
demostrar que ez (2) es divisible por e, (à). Supongamos que 


e0)=e0)9 0) +1 0), 


donde r ()%0 y el grado de r (4) es menor que el dee, (à). Pero, 
agregando a la segunda columna de la matriz (3) su primera columna 
multiplicada por q (2) y restando después de la segunda fila la 
primera, se sustituye el elemento ez (2) por el elemento r (2). Per- 
mutando Juego las primeras dos filas y las primeras dos columnas, 
conseguiremos trasladar el polinomio r (2) al ángulo superior de la 
izquierda de la matriz, lo cual, sin embargo, contradice a la elección 
del polinomio e, (à). 

EL teorema de la reducción de una A-matriz a la forma canónica 
queda demostrado. Este teorema se puede completar con el siguiente 
teorema de unicidad: 
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Toda -matriz es equivalente solamente a una matriz canónica. 
En efecto, sea dada una A-matriz arbitraria A (4) de orden n. 
Fijemos algún número natural k, 1<k<n, y consideremos todos 
los menores de k-ésimo orden de la matriz A (2). Calculando estos 
menores obtenemos un sistema finito de polinomios en 4; designemos 
con dy (2) el máximo común divisor de este sistema de polinomios, 
tomado con el coeficiente superior 1 
Por consiguiente, tenemos los polinomios 


A), de, da G), (4) 


determinados unívocamente por la misma matriz A (à). Aquí, 
di (2) es el máximo común divisor de todos los elementos de la 
matriz A (à), tomado con el coeficiente superior 1, y d, (A) es igual 
al determinante de la matriz A (2), dividido por su coeficiente 
superior. Obsérvese también, que si la matriz A (2) tiene rango r, 
entonces 


den 0) =...=d,(1)=0, 


mientras que todos los demás polinomios del sistema (4) son distin- 
tos de cero. 

El máximo común divisor dą (0) de todos los menores de k-ésimo 
orden de una -matriz A (%), k = 1, 2, ..., n, no varía al realizar 
transformaciones elementales en la matriz A (0). 

Esta proposición es casi evidente, si se efectúan transformaciones 
elementales del tipo 1) y 2) en la matriz A (A). Así, por ejemplo, si 
la ¿-ósima fila de la matriz se multiplica por un número æ del campo 
P, œ + 0, todos los menores de k-ésimo orden, por los que pasa la 
¿-ósima fila, se multiplicarán por æ, mientras que los demás menores 
de k-ésimo orden se quedarán invariables. Mas, al buscar el máximo 
común divisor de unos cuantos polinomios, cualesquiera de éstos 
se pueden multiplicar por números del campo / distintos de cero. 

Examinemos ahora las transformaciones elementales del tipo 3) 
y 4). Supongamos, por ejemplo, que a la ¿-ésima fila de la matriz 
A (À) se le agrega su j-ésima fila, j 4 i, multiplicada por el polinomio 
« (À); designemos con A (A) la matriz que resulta después de esta 
transformación y con d, (4), el máximo común divisor de todos sus 
menores de k-ésimo orden, tomado con el coeficiente superior 1. Vea- 
mo orden de la matriz 


mos lo que ocurre con los menores de k- 
A (4) al hacer esta transformación. 


Está claro que no varían los menores por los que no pasa la 
i-ésima fila. Tampoco varían los menores por los que pasan la 
¿ósima y la j-ósima filas, pues el determinante no varía al sumar 
a una de sus filas un múltiplo de otra fila. Por fin, tomemos cual- 
quiera de los menores de A-ésimo orden por los que pasa la ¿-ésima 
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fila, pero no pasa la j-ésima; designémoslo mediante M. Evidente- 
mente, el menor correspondiente de la matriz A (à) se puede repre- 
sentar en forma de una suma del menor M y de un menor M”, multi- 
plicado por « (À), donde este último es el menor de la matriz A (A) 
que se obtiene del menor M al sustituir los elementos de la ¿-ésima 
fila de la matriz A (A) por sus elementos correspondientes de la 
j-ésima fila. Como M y M’ son divisibles por d, (2), también será 
divisible por d, (A) la suma M + q (À) M’. 

De lo dicho se deduce, que todos los menores de k-ósimo orden 
de la matriz A (À) son divisibles por d, (4), por lo cual, d» (A) tam- 
bién es divisible por d, (A). Pero, como para Ja transformación 
elemental considerada existe una transformación elemental inversa 
del mismo tipo, dy (à) también es disvisible por 2, (A). Si se tiene 
en cuenta que los coeficientes superiores de estos polinomios son 
iguales a 1, se tiene d (2) = da (à), como se quería demostrar. 

Por lo tanto, a todas las }-matrices equivalentes a la matriz A (A) 
corresponde una misma colección de polinomios (4). En particular, 
esto mismo se refiere a cualquier (si hay varias) matriz canónica 
equivalente a A (2). Supongamos que (3) es una de estas matri 

Calculemos el polinomio dy (à), k =1,2,..., m, utilizando 
la matriz (3). Está claro, que el menor de k-ésimo orden que figura 
en el ángulo superior de la izquierda de esta matriz, es igual al 


producto 
eb) es (A)... ex 0). (5) 


Si, luego, se toma en la matriz (3) el menor de k-ésimo orden que 
figura on las filas cuyos índices son di, iz... in, donde i < 
< ln, y en las columnas que tienen los mismos indices 
de ordenación, resulta que este menor es igual al producto 
en (A) eia (A) Ci (0), el cual es divisible por (5). En efecto, 
1<i y, por eslo, e; ¿ 0) es divisible por es (4); 2< ix, y por esto, 
en 0) es divisible por es (2), ete. Finalmente, si en la matriz (3) 
so toma el menor de k-ósimo orden por el que pasa, al menos para 
una ¿, la i-ésima fila de esta matriz, pero no pasa su ¡-ésima columna, 
resulta que este menor contiene una fila nula, por Jo cual, es igual 
a cero. 

De lo expuesto se deduce, que el producto (5) es el máximo 
común divisor de todos los menores de k-ésimo orden de la matriz (3) 
y, por consiguiente, de la matriz inicial A (å), 


di0)=e, (0) 0200) ex (0), k=1, 2.0. (6) 
Ahora es fácil demostrar que los polinomios ez (4), k = 1, 2, 


+, n, se determinan univocamente por la misma matriz A (2). Supon- 
gamos que el rango de esta matriz esr. Entonces, como ya Sabemos, 


L haisi 
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d, (4) 20, pero d+, (à) = 0, y por esto, en virtud de (6), e-+, (4) = 
= 0. De aquí, en virtud de las propiedades de la matriz canónica, 
se deduce, en general, que si el rango r de la matriz A (A) es menor 
que n, entonces, 


er (0) = era (1) = ~. - =en (1) =0. a) 

Por otra parte, para k <r, como dr-ı(å)Æ0, de (6) resulta que 
5 dr (2) 

an=. 8) 


Con esto se termina la demostración de la unicidad de la forma 
canónica de una A-matriz. 

Al mismo tiempo hemos obtenido un método para hallar direc- 
tamente los polinomios ex (A) llamados factores invariantes de la 
matriz A (2). 


Ejemplo. Reducir a la forma canónica la }-matriz 

AA 2% 

22154 32)" 

Efectuando una cadena de transformaciones elementales, obtenemos: 


2 Lan 10 
a (Po 3 (ps %).. 
ALLS A ALSA A 


-i °)~ Paa » E 
* X 0 » 


an= 


p o 
o diia) x 
nte los factores invariantes de la matriz 


Poro se podrían calcular directan 
mo común divisor de los elementos de 


A (A). Precisamente, calculando el 
esta matriz, obtenemos: 
a A= Ah. 


Calculando el determinante de la matriz A (.) y observando que su coefi- 
ciente superior es igual a 1, resull 


de (A) =24 — 103—322, 


00-48 


y, por esto, 
=253—1012—32.. 


$ 60. %-matrices unimodulares. Relación entre la semejanza 
de las matrices numéricas y la equivalencia 
de sús matrices características 


De los resultados del párrafo precedente se desprende un criterio 
de equivalencia de las A-matrices, que se puede formular de los 
siguientes dos modos, que son casi idénticos: 
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Dos h=matrices son equivalentes si, y sólo si, éstas se reducen a una 
misma forma canónica. 

Dos i-matrices son equivalentes si, y sólo si, éstas tienen factores 
invariantes iguales. 

Deduzcamos otro criterio de carácter distinto. 

Ya sabemos que al conjunto de las A-matrices canónicas pertenece 
la matriz unidad Æ. Llamemos a una %-matriz U (A) unimodular, 
si su forma canónica coincide con la matriz unidad E, o sea, si todos 
sus factores invariantes son iguales a la unidad. 

Una h-matriz U (A) es unimodular si, y sólo si, su determinante 
es distinto de cero, pero no depende de)., o sea, si es un número del campo 
fundamental P, distinto de cero. 

En efecto, si U (à) —E, a estas dos matrices les corresponde un 
mismo polinomio d, (À). Pero, para la matriz unidad, d, (À) = 1. 
De aquí se deduce que el determinante de la matriz U (à), que se 
diferencia de d, (2) solamente en un factor numérico distinto de 
cero, es un número del campo P, distinto de cero. Recíprocamente, si el 
determinante de la matriz U (4) es diferente de cero y no depende 
de A, entonces, para esta matriz, el polinomio d, (A) será igual a 1, 
por lo cual, según (6) del párrafo anterior, todos los factores invarian- 
tes e; (4) de la matriz U (A), i 1,2,..., n, son iguales a la 
unidad. 

De aquí se deduce que, toda matriz numérica no degenerada es 
una -matriz unimodular. Pero, una A-matriz unimodular puede 
ser de forma complicada. Así, pues, la 2-matriz 

h 45 
Mica —P408 4-54 — 5, 
es unimodular, pues su determinante es igual a 20, o sea, es distinto 
de cero y no depende de 2. 

Del teorema demostrado anteriormente se deduce que, el producto 
de \-matrices unimodulares es unimodular, pues, es suficiente recordar 
que, al multiplicar matrices, sus determinantes se multiplican. 

Una )-matriz U (A) es unimodular si, y sólo si, existe la matriz 
inversa y ésta es una %-matriz. 

En efecto, dada una A-matriz no degenerada, buscando de un 
modo ordinario la matriz inversa, tendremos que dividir los comple- 
mentos algebraicos de los elementos de la matriz dada por el deter- 
minante de ésta, o sea, por un polinomio en 2. Por esto, en el caso 
general, los elementos de la matriz inversa serán fracciones racionales 
en À, pero no polinomios en À, o sea, esta matriz no será una 2-matriz. 
Si se da una matriz unimodular, habrá que dividir los complementos 
algebraicos solamente por un número del campo P, distinto de cero, 
o sea, los elementos de la matriz inversa serán polinomios en A, 
por lo cual, la misma matriz inversa será una A-matriz. Recíproca- 
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mente, si una A-matriz U (à) tiene %-matriz inversa U7! (A), los 
determinantes de ambas matrices serán polinomios en 2, su producto 
será igual a 1, por lo cual, ambos determinantes tendrán que ser 
polinomios de grado cero. 

De la última observación, se deduce el siguiente complemento 
del teorema que acabamos de demostrar: 

Una d-matriz que es inversa a una -matriz unimodular, es también 
unimodular. 

EL concepto de m a en el enunciado 
siguiente del nuevo eriterio de equivalencia de las 2-matrices: 

Dos -matrices A (2) y B (2) de orden n son equivalentes si, y sólo 
i, existen unas )-matrices unimodulares U (A) y V (%) del mismo orden 
n, tales que 


B) =U 0) A WV 0). (1) 


Introduzcamos primero el siguiente concepto, que se emplea 
en la demostración de este criterio. Llamemos matriz elemental a la 
matriz numérica (que, por lo lanto, es una 2-matriz 


-10 (2) 


que se diferencia de la matriz unidad solamente en que, en cierto 
¿ósimo lugar de la diagonal principal, 1<¿<n, figura un número 
arbitrario æ del campo P, distinto de cero. Por otra parte, llamemos 
también matriz elemental a la A-matriz 


1 i 


8} 
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que se diferencia de la matriz unidad solamente en que, en la inter- 
sección de la i-ésima fila y la j-ésima columna, 1<i<n, 1< 
«<n, siendo ¿+ j, figura un polinomio arbitrario q (A) del ani- 
llo P [Al. 

Toda matriz elemental es unimodular. En efecto, el determinante 
de la matriz (2) es igual a œ, pero, por la condición, æ + 0; por otra 
parte, el determinante de la matriz (3) es igual a 1. 

La ejecución en una ì-matriz A (}) de cualquier transformación 
elemental es equivalente a la multiplicación de esta matriz a la izquierda 
o a la derecha por una matriz elemental. 

En efecto, el lector comprobará sin dificultad la justeza de las 
cuatro proposiciones siguientes: 1) multiplicar la matriz A (4) a la 
izquierda por la matriz (2) equivale a multiplicar la ¿-ésima de la 
matriz A (à) por el número æ; 2) multiplicar la matriz A (0) a la 
derecha por la matriz (2) equivale a multiplicar la ¿-ósima columna 
de la matriz (2) por el número «; 3) multiplicar la matriz A (2) a la 
izquierda por la matriz (3) equivale a sumar a la ¿ósima fila de la 
matriz A (À) su j-ésima fila, multiplicada por y (à); 4) multiplicar 
la matriz A (A) a la derecha por la matriz (3) equivale a sumar 
a la j-ésima columna de la matriz A (2) su ¿ésima columna, 
multiplicada por $ (). 

Pasemos a demostrar ahora nuestro eriterio de equivalencia 
de las A-matrices. )=B (à), de la matriz A (A) se puede 
pasar a la matriz B (à) realizando un número finito de transfor- 
maciones elementales. Sustituyendo cada una de estas transforma- 


ciones por la multiplicación a la izquierda o a la derecha, por una 
matriz elemental, llegaremos a la siguiente igualdad: 

BA =U)... U AAA V A) -o VO), a) 
donde todas las matrices Us (A)... Un Q), Vi (8)... Vi A) 


ente, unimodulares. Por esto, serán 
trices 


0), VMO=V,0) ... vO), (5) 
$, y la igualdad (4) se 


son elementales y, por con 
también unimodulares las ma 


U(0)=0,(%) 


que son productos de matrices unimodulares 
escribirá de la forma (1). Obsérvese que si, por ejemplo, k = 0, 
o sea, que se efectuaron transformaciones elementales solamente 
sobre las columnas, entonces, ponemos simplemente (A) = E. 

La parte ya demostrada permite a la vez enunciar la siguiente 
proposición: 

Una i-matriz es unimodular si, y sólo si, ésta se representa en forma 
de un producto de matrices elementales. 

En electo, ya hemos empleado el hecho de que el producto de 
matrices elementales es unimodular. Recíprocamente, una matriz 
unimodular arbitraria W (4) es equivalente a la matriz unidad E. 
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Aplicando a las matrices E y W (2) la demostración que se llevó 
a cabo con las matrices A (2) y B (2), de (4) obtenemos la igualdad 


W()=0,(0) --- UV È) V G) --. Ve), 


o sea, la matriz W (à) ha quedado representada en forma de un 
producto de matrices elementales. 

Ahora es fácil demostrar la proposición recíproca de nuestro 

rio. Supongamos que para las matrices A (A) y B (A) existen 
s matrices unimodulares U (2) y V (2) tales, que se verifica la 
maldad (1). Por lo demostrado, las matrices U (A) y V (A) se 
pueden representar en forma de productos de matrices elementales; 
supongamos que (5) son las representaciones dichas. La igualdad (1) 
se escribirá ahora en la forma (4) y, sustituyendo cada multiplica- 
ción por una matriz elemental por su transformación elemental 
correspondiente, obtenemos, por fin, que A (1)—8 (2). 

Polinomios matriciales. El concepto de ¿-matriz se puede inter- 
pretar de otro modo. Llamemos A-polinomio matricial de orden n sobre 
el campo P a un polinomio en A cuyos coeficientes son matrices 
cuadradas de un mismo orden z, con elementos del mismo campo P; 
su forma general es: 


AAt HAA h. Ane (6) 


Entendiendo el producto de la matriz A; por, i = 0, 4, ..., ka 
en correspondencia con el $ 15, como el producto de todos los ele- 
mentos de la matriz A, por 2'-!, y efectuando después la suma de 
las matrices de acuerdo con el mismo $ 15, obtenemos que, todo 
A-polinomio matricial de orden n se puede expresar en forma de una 
dematriz de orden n. Así, pues, 


(pelo delo 2) (o 0)- 


(e > 349441 ) 


-3 142 


cri 


H And- 


Recíprocamente, toda A-matriz de orden n se puede expresar en 
forma de un -polinomio matricial de orden n. Así, pues, 
3—5 A41) /0 0 (3.0 /0 4 5 4 
a 24 a í 
(ca 23) fi o)? z(o pe Ha o) + ( 0 Ga 
La correspondencia entre las 2-matrices y los 2-polinomios matri- 
ciales es biunívoca e isomoría en el sentido del $ 46. En efecto, la 
igualdad de los +-polinomios de la forma (6) como matrices es equiva- 
lente a la igualdad de los coeficientes matriciales de potencias igua- 
les de A, y la multiplicación de una matriz por à es equivalente 
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a su multiplicación por una matriz escalar con A en la diagonal 
principal. 
Sea dada una }-matriz A (2), siendo 


A)=AJ GANA no H AnA HAr 


donde la matriz Aj no es nula. Al número k lo llamaremos grado 
de la A%-matriz A (A); evidentemente, éste será el grado superior 
(respecto a A) de los elementos de la matriz A (A). 

La consideración de las -matrices como polinomios matriciales 
permite desarrollar para las )/-matrices una teoría de divisibilidad 
análoga a la teoría de divisibilidad de los polinomios numéricos, 
pero, naturalmente, más complicada porque el producto de las matrices 
no es conmutativo y por la existencia de divisores de cero. Nos 
limitaremos a estudiar el algoritmo de la división con resto. 

Sean dadas sobre el campo P las )-matrices de orden n: 


AM) = AA a AA Apdo Am 
BM)=BA BRA H BiBi 


supongamos que la matriz Bo no es degenerada, o sea, que existe la 
matriz B;*. Entonces, sobre el campo P se pueden hallar unas }-matri- 
ces Q, (A) y R, (à) del mismo orden n, tales que 


A (A) = B (4) Q, (A) + R: A), (7) 


donde el grado de R, (0) es menor que el grado de B (h), o bien, 
R, () Ò. Por otra parte, sobre el campo P se pueden hallar unas 
dematrices Qu (4) y Ra (h) de orden n, tales que 


A) = Q (A) B ()-+ Ra O), (6) 


donde el grado de It.(%) es menor que el grado de B (0), o bien, 
Ra (à) = 0. Las matrices Q, (2) y R, (2), y también Qs À) y Ra (0), 
que satisfacen a estas condiciones, se determinan univocamente. 

La demostración de este teorema ña del mismo modo que 
¡ón del teorema correspondiente para los polinomios 
numéricos (vóase el $ 20). Supongamos, por ejemplo, que a la con- 
dición (7) satisfacen también las matrices Q, () y KW, (), donde 
ul grado de R, (4) es menor que el de B (2). Entonces, 


B()10,()—Q1 0) = Ra O) R (2). 


nenor que Z, mientras que el grado 
del primer miembro es mayor o igual a 2, si la expresión entre cor- 
chotes os diferente de cero, puesto que la matriz Bo no es degenera- 
da. De aquí se deduce la unicidad de las matrices Qi (2) y Ri (0). 


25-262 


El grado del segundo miembro es 
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Para demostrar la existencia de estas matrices, observemos que, 
para k>1, el grado de la diferencia 


A()—B0)-B,". 


es estrictamente menor que k; por esto, ByTAj'=I será el término 
superior del A-polinomio matricial Q, (à). A continuación se obra 
igual que en el $ 20. Por otra parte, el grado de la diferencia 


A (A) — AB W.B (0) 


también es estrictamente menor que k, o sea, AoBo™A" es el 
término superior del A-polinomio matricial Q (2). Vemos, pues, 
que en el caso general, las A-matrices Q, (4) y Q2 (à) (y también 
R, 0) y Ro (0)), que satisfacen a las condiciones del teorema, verda- 
deramente, son distintas. 

Teorema fundamental de la semejanza de las matrices. Como 
ya se señaló, todavía no conocemos un procedimiento para responder 
a la pregunta si unas matrices numéricas dadas A y B (o sea, matri- 
ces con elementos del campo fundamental P) son semejantes o no. 
Por otra parte, sus matrices características A —2E£ y B — AE son 
A-matrices y el problema de la equivalencia de estas matrices 
se resuelve de un modo efectivo. Por esto, se comprende el valor 
tan grande que tiene el siguiente teorema: 

Las matrices A y B, con elementos del campo P, son semejantes 
si, y sólo si, sus matrices características A —AE y B — ME son equiva- 
lentes. 

En efecto, supongamos que las matrices A y B son semejantes, 
o sea, que sobre el campo P existe una matriz no degenerada C 
tal, que 


hal 


B= 


HAC, 
Entonces 
CA(AAE)C=CAHAC—2(CAEC) =B—AE. 

Pero las matrices numéricas no degeneradas C~! y C son A-matrices 
unimodulares. Vemos, pues, que la matriz B — AE se obtiene multi- 
plicando la matriz A —AE a la izquierda y a la derecha por matrices 
unimodulares, o sea, A —}E ~ B —AE. 

La demostración del teorema recíproco es más complicada. 
Supongamos que 


AMB ~ B—AE. 
Entonces, existen unas matrices unimodulares UY (2) y V(Q) 
tales, que 
UM) (4—AE) V (A) =B—AE. (9) 
Teniendo en cuenta que para las matrices unimodulares existen 
las matrices inversas y éstas son A-matrices, de (9) deducimos las 
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siguientes igualdades, que se emplean a continuación: 
DO)A2E)=(B2E)V= (M, } 
(AAE)V (2) =U- (0) (B—2E). 


Como la A-matriz B — AE es de grado 1 con respecto a A, y ade 
más, el coeficiente superior del polinomio matricial correspondiente 
es la matriz no degenerada —E, a las matrices U (A) y B — AE 
se les puede aplicar el algoritmo de la división con resto, según el cual, 
existen unas matrices Q, (à) y R (esta última, si es distinta de cero, 
tiene que ser de grado O con respecto a A, o sea, no depende de A), 
tales, que 


(10) 


U (0) =(B=2E)Q1 (0) + Ra. (11) 


De modo análogo, 
V (A) = Q3 (4) (B—AE) + Ro. (12) 


Aplicando (14) y (12), de (9) obtenemos: 
RAE) R, = (B2E)—U (4) (A—2E) Q; (2) (B— AE) 
— (BE) Qi 0) (AL) V 0) -+ (824) Q, 0) (A—2L) Q,(B— AL) 
o, en virtud de (10), 

R, (A—hE) R= (B— hE) — (B— AE) V (4) 0,0) (B—2E)— 
— (BM) Q, 0) U7 A) (B— , 
+(B—AE)Q, Q) (AE (BALE) x 
X (E — (V (0) Q: (A) + Q (4) U 0) — Q, O(A — AE) Q3 A) (B —AE)} 


La expresión que figura entre corchetes en el segundo miembro, 
verdaderamente, es igual a cero. En caso contrario, ésta, siendo 
una A-matriz, puesto que V= (à), así como U- (2), son A-matrices, 
a por lo menos de grado cero y, entonces, el grado de la expre 
ón entre llaves sería no menor que Í y, por consiguiente, el grado 
de todo el segundo miembro no sería menor que 2. Pero, esto es 
imposible, puesto que en el primer miembro figura una A-matriz 
de grado 1 
Por lo tanto, 


RAE) Ro=B2E, 
de donde, igualando los coeficientes matriciales de potencias iguales 
de A, obtenemos: 

RAR¿=B, (13) 
RiN¿= E. (14) 
25» 
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La igualdad (14) muestra que la matriz numérica R, no sólo es 
distinta de cero, sino incluso no degenerada, siendo 


y entonces, la igualdad (13) toma la forma 
RAAR¿=B, 


lo cual demuestra la semejanza de las matrices A y B. 

A la vez, hemos aprendido a hallar la matriz A, no degenerada 
que transforma la matriz A en la matriz B. Precisando, si Jas ma- 
trices A —AE y B —ALE son equivalentes, entonces con un número 
finito de transformaciones elementales se transforma la primera en la 
segunda. Tomemos las transformaciones de éstas que se relacionan 
a las columnas, y designemos mediante V (2) el producto de las 
matricos elementales correspondientes, tomadas en el mismo orden. 
Dividamos después V (4) por B — 2E, de modo que el cociente quede 
a la izquierda del divisor (véase (8). El residuo de esta división 
será la matriz Ry. 

En realidad, se puede prescindir de Ja división indicada, utili- 
zando el siguiente lema que hallará también aplicación en el $ 62: 

Lema. Sea 


VEVA VAA VA Va, Vo 0. (15) 
4 V (à) = (2E — B) Qi (à) + Ry, (16) 
V()=02(%) QE — B) + Ro, 
se tiene 
Ri=BV + BV, 4 BV oa HV (17) 
Ry=V,B'+V,B" VB AV an 


Es suficiente demostrar, por ejemplo, la primera de estas dos 
afirmaciones, pues la segunda se demuestra por analogía. La demos- 
tración consiste en la comprobación directa del cumplimiento 
de la igualdad (16); para esto el polinomio V (À) se sustituye por su 
expresión (15), en lugar de R, se pone (17) y en vez de Q; (à) se toma 
el polinomio 


Qi A) = VA + (BV, + Vi) 2 


+ (BV) + BV +V)... 
BABA Vamo 


La prueba de esto la dejamos a cuenta del lector. 
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Ejemplo. Sean dadas las matrices 
21 (2 —4 
26 11)* 


Sus matrices características son equivalentes, puesto que se reducen a una 
misma forma canónica 


1 o 
lo 19-30) y 
por osto, las matrices A y B son semejantes. 


Para hallar la matriz Xs que transforma A en B, hallemos alguna cadena de 
transformaciones elementales que transforme A — AE en B — AE. 


Así, pues, 
ARE (Ersta) a (ón 11) Si 
A e (Ta aca) 2-a: 


Las dos últimas transformaciones se refieren a las columnas: a la primera{colum- 
na se suma la segunda, multiplicada por —8, y después, la primera columna se 


1 El producto de las matrices elementales correspondientes es 


1 1 
1 0) /-3 _(-70 
v()=- ( 4 )- ( 4 ) 
(51) éi $ á 
Esta matriz no depende de A, por lo cual , ésta será la matriz Ma buscada. 


Claro, la matriz que transforma A en Æ está muy lejos de determinarse uní- 
vocamente. Tal es también, por ejemplo, la matriz 


Ed 
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multiplica por,—, 


Ahora estudiaremos las matrices cuadradas de orden n con ele- 
montos del campo P. Se distinguirá un tipo especial de matrices 
de éstas, llamadas matrices de Jordan, y se domostrará que estas 
matrices sirven de forma normal para una clase de matrices muy 
amplia. Precisando, las matrices cuyas raíces características perte- 
necen al campo fundamental P (y solamente tales matrices), son seme- 
jantes a ciertas matrices de Jordan, o, como suele decirse, se reducen 
a la forma normal de Jordan. De aquí se deducirá que, si se toma 
pos P el campo de los números complejos, cualquier matriz con elemen- 
tos complejos se reduce a la forma normal de Jordan en este campo. 

Introduzcamos las definiciones necesarias. Se llama «malla» de 
Jordan de orden k correspondiente al número 2, la matriz de orden 
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k, 1<k<n, que tiene la forma 


das 1 
w% 1 


e 


1 
l 


o 2! 


en otras palabras, en su diagonal principal figura un mismo número 
ñg del campo P; la paralela, situada por encima de la diagonal 
principal y más próxima a ésta, está ocupada totalmente por el 
número 1; todos los demás elementos de la matriz son iguales a cero. 


Así, pues, 
wi 0 
dy 1 
(UN ( Y 0% 41 
xo» 00d 
son mallas de Jordan de primero, segundo y tercer orden, respecti- 
vamente. 


Se llama matriz de Jordan de orden n a la matriz de order n que 
tiene la forma 


0 J, 


/ 


aquí, a lo largo de la diagonal principal figuran las mallas de Jor- 
dan Ji, Ja, ..., Y, de ciertos órdenes, que necesariamente no son 
distintas, y que corresponden a ciertos números del campo P, tam- 
poco necesariamente distintos; todos los lugares fuera de estas 
mallas están ocupados por ceros. Aquí, s>14, o sea, una malla 
de Jordan de orden n pertenece al conjunto de las matrices de Jordan 
de este mismo orden y, naturalmente, s <n. 
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Obsérvese, a pesar de que esto no se va a aplicar a continuación, 
que se podría haber descrito la estructura de la matriz de Jordan 
sin recurrir al concepto de célula de Jordan. Así, pues, es evidente 


que una matriz es de Jordan si, y sólo si, ésta tiene la forma 
A e 
G y 
TE T 
o è 
An 
donde Ai, ¿ = 1, 2, . m, son números arbitrarios del campo P, 


y cada e}, j = 1, 2, n — 1, es igual a la unidad o a cero, siendo 
dy = j+, cuando ey = 4. 

Las matrices diagonales son casos particulares de las matrices de 
Jordan; éstas son precisamente las matrices de Jordan cuyas mallas 
son de orden 4. 

Nuestro objetivo próximo consiste en hallar la forma canónica 
para la matriz característica J —2E de una matriz arbitraria de 
Jordan J, de orden n. Hallemos primero la forma canónica para 

mat característica 


Ay —A 


0 


a 8) 


\ o d—h» 
de una malla de Jordan (1), de orden k. Calculando el determinante 
de esta matriz y recordando que el coeficiente superior del poli- 
nomio d, (A) tiene que ser igual a 1, obtenemos, 

dy (à) =(A—2)". 
Por otra parte, entre los menores de (k — 1)-ésimo orden de la ma- 
triz (3) hay uno que esigual a la unidad, precisamente, el que resulta 


después de haber suprimido la primera columna y la última fila 
de esta matriz. Por esto, 
dr (à) = 1. 
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De aquí se deduce que la forma canónica de la matriz (3) es la 
siguiente A-matriz de orden k: 
1 o 


(4 


1 
o (A— A)" 
Demostremos ahora el lema que sigue: 
Si los polinomios (2), 92 (0) 
primos entre sí dos a dos, se verifi 


P(A) 
62 (4) 


qu (A) del anillo PIA) son 
siguiente equivalencia: 


0 


a 
, ñ 
o PA) o Le 
Evidentemente, es suficiente considerar el caso t = 2. Como los 
polinomios q, (A) y qa (À) son primos entre sí, en el anillo P [Al 


existen unos polinomios uy (À) y uz (2), tales que 
Pi (A) us (A) + Pa 0) uz (A) = 1. 


Por esto, 
(eo 0 ro a a 
0 q) 0 Pa) 
ay E E o 1 j= 
0 Palà) O q) 


~lan "lo -amaw 


1 ) 1 0 ) 
lo — 10) 920), lo MAA? 
como se quería demostrar. 
Consideremos ahora la matriz característica 
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dela matriz de Jordan J de la forma (2); aquí, En 11,2, ...,s, es 
la matriz unidad del mismo orden que la malla J,. Supongamos que las 
mallas de Jordan de la matriz J corresponden a los siguientes núme- 
ros distintos: Ay, Ag, ..., An donde £<s. Supongamos también 
que al número A, ¿ = 4, 2, .. ., t, corresponden q; mallas de Jor- 
dan, qu>1, y sean los órdenes de éstas, colocados en orden no cre- 
ciente, los números . 
ku> ka>- > kiy (6) 


Obsérvese, a pesar de que no vamos a utilizar esto, que 


t 
Da=s, 


con 
Y D ky=n. 
ag 

Aplicando transformaciones elementales a las filas y columnas 
de la matriz (5) que pasan por la malla J; — AE, de esta matriz, 
no se tocan, evidentemente, las otras mallas diagonales. De aquí 
se deduce que en la matriz (5), mediante transformaciones elementa- 
les, se puede sustituir cada malla J; —2E¡, i = 4, 2, ..., $, por 
la 'malla correspondiente de la forma (4). En otras palabras, la 
matriz J — ME es equivalente a una matriz diagonal, en cuya diagonal, 
además de ciertas unidades, figuran también los siguientes polinomios. 


que corresponden a todas las mallas de Jordan de la matriz J; 


AA, (AAA, AA) i, ] 


tl m 


AA, MA) 


En este caso, no indicamos los lugares en la diagonal donde figuran 
los polinomios (7), puesto que en cualquier 2-matriz diagonal, los 
elementos diagonales se pueden cambi arbitrariamente 
permutando las y las columnas ho: ta observación 
se debe tener en cuenta a con 

Sea q el máximo entre los númer 1,2, +... £. Designe- 
con en. (À) el producto de los polinomios que figuran en la 
ima columna de la tabla ( as q, 0 SCA, 


m 


esmi 


t 
=i l (hi) M (8) 


si en este caso en la j-ésima columna hay sitios vacios (para alg 
i puede ocurrir que q; < j), suponemos que los factores correspon- 
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dientes en (8) son iguales a la unidad. Como, por la condición, los 
números A, 42, .. ., Ae son distintos, los grados de los binomios 
lineales que figuran en la j-ésima columna de la tabla (7) son primos 
entre sí dos a dos. Por esto, según el lema demostrado anteriormente, 
mediante transformaciones elementales, estos binomios se pueden 
sustituir en la matriz diagonal considerada por su producto en-j+ (À) 
y cierta cantidad de unidades. Haciendo esto para j = 1,2, .-., q, 
obtenemos que 


1 o 
1 
JB = 4 Eng (À) s (9) 
en) 
0 En (À) 


Esta es la forma canónica buscada de la matriz J — }E. En efecto, 
los coeficientes superiores de todos los polinomios que figuran en 
(9) en la diagonal principal, son iguales a la unidad, y, en virtud 
de la condición (6), cada uno de estos polinomios es divisible por el 
precedente. 


Ejemplo. Sea 


Para esta matriz de Jordan de noveno orden, la tabla de polinomios (7) es 
de la forma 


(A—2)%, A—2, 4—2, 
(A—5)2, (A—5)2 
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Por esto, los factores invariantes de la matriz J son: 

a= 05), 

=(M—2 0—5 
22 


mientras que ep(2)=. 


Ahora que hemos aprendido a escribir inmediatamente jla forma 
canónica de su matriz característica, partiendo de la forma dada 
de Jordan J, se puede demostrar el siguiente teorema: 

Dos matrices de Jordan son semejantes si, y sólo si, éstas constan 
de unas mismas mallas de Jordan, o sea, que solamente pueden dife- 
renciarse en el orden de colocación de estas mallas a lo largo de la diago- 
nal principal. 

En efecto, la tabla de polinomios (7) se determinaba completa- 
mente por el conjunto de las mallas de Jordan de la matriz de Jor- 
dan J, y en ella de ningún modo se reflejaba la colocación de las 
mallas de Jordan a lo largo de la diagonal principal de esta matriz. 
De aquí se deduce que, si las matrices de Jordan J y J’ poseen una 
misma colección de mallas de Jordan, a éstas corresponde una misma 
tabla de polinomios (7), y por esto, unos mismos polinomios (8). 
Por lo tanto, las matrices características J — AE y J' — hE tienen 
unos mismos factores invariantes, o sea, son equivalentes, y por 
lo tanto, las matrices J y J’ son semejantes. 

Recíprocamente, si las matrices de Jordan son semejantes, sus 
matrices características tienen iguales factores invariantes. Supon- 
gamos que los polinomios (8) para j = 1, 2, + . .. q, son los factores 
invariantes de éstos, que son distintos de la unidad. Pero, con los 
polinomios (8) se restablece la tabla de los polinomios (7). Más 
exactamente, los polinomios (8) se descomponen en productos de 
potencias de factores lineales, puesto que, como ya se ha demostrado, 
para cualquier matriz de Jordan los factores invariantes de la matriz 
característica poseen esta misma propiedad. Precisamente, la tabla 
(7) consta de las potencias máximas de los factores lineales en que 
se descomponen los polinomios (8). Finalmente, con la tabla (7) se 
restablecen las mallas de Jordan de las matrices iniciales de Jordan, 
pues, a cada polinomio (2 — 2;)'4 en la tabla (7) corresponde una 
malla de Jordan de orden kij, correspondiente al número A;. Con 
esto, queda demostrado que las matrices J y J” constan de unas 
mismas mallas de Jordan y que se pueden diferenciar solamente 
por la colocación de éstas. 

En particular, de este teorema se deduce que, una matriz de 
Jordan que es semejante a una matriz diagonal, es también diagonal, 
y que dos matrices diagonales son semejantes si, y sólo si, se diferencian 
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entre sí en una permutación de los números que figuran en la diagonal 
principal. 

Reducción de una matriz a la forma normal de Jordan. Si una 
matriz A con elementos del campo P se reduce a la forma normal de 
Jordan, o sea, es semejante a una matriz de Jordan, entonces, como 
esto se deduce del teorema demostrado más arriba, la forma normal 
de Jordan se determina por la matriz A unívocamente, salvo el orden 
de colocación de las mallas en la diagonal principal. La condición 
para que la matriz A permita tal reducción se indica en el siguiente 
teorema, cuya demostración nos proporciona a la vez un método 
práctico para hallar la matriz de Jordan que es semejante a la ma- 
triz A, si tal matriz de Jordan existe. Obsérvese en este caso, que 
la reducción en el campo P significa que todos los elementos de la 
matriz con la que se efectúa la transformación pertenecen al campo P. 

Una matriz A con elementos del campo P se reduce en este campo 
a la forma normal de Jordan cuando, y sólo cuando, todas las raices 
características de la matriz A pertenecen al mismo campo fundamental P. 

En efecto, si la matriz A es semejante a una matriz de Jordan J, 
entonces, estas dos matrices tienen unas mismas raíces caracterís- 
ticas. Pero las raíces características de la matriz J se hallan sin 
dificultad alguna; como el determinante de la matriz J —2£ es 
igual al producto de sus elementos que están en la diagonal princi- 
pal, el polinomio | J — AE | se descompone sobre el campo P en 
factores lineales y los números que están en la diagonal principal 
de la matriz J, y sólo éstos, son sus raices. 

Recíprocamente, supongamos que todas las raíces características 
de la matriz A pertenecen al mismo campo P. Si 


ln-gu (A), -o-s ena (À), en (2), (10) 


son los factores invariantes de la matriz A—AL£ distintos de 1, 
entonces, 


JAAL 


— 1)" egos (À) > > Ens (À) en (4). 


En efecto, los determinantes de la matriz A —A£ y de su matriz 
canónica sólo pueden diferenciarse entre sí en un factor constante 
que, en realidad, es igual a (—1)", puesto que así es el coeficiente 
superior del polinomio característico | A — AE |. Por lo tanto, 
entre los polinomios (10) no hay iguales a cero, la suma de los grados 
de estos polinomios es igual a z y todos ellos se descomponen sobre 
el campo P en factores lineales; esto último es debido a que, por 
la condición, el polinomio | A — AE | tiene tal descomposición. 

Sean (8) las descomposiciones de los polinomios (10) en productos 
de potencias de factores lineales. Llamemos divisores elementales del 
polinomio tay, j= 1, 2, ..-, q, a las potencias de distintos 
binomios lineales, diferentes de la unidad, que figuran en su descom- 
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posición (8), o sea, 
(AA), MAJA, AA 


A los divisores elementales de todos los polinomios (10) los lla- 
maremos divisores elementales de la matriz A y los escribiremos en 
forma de la tabla (7). 

Tomemos ahora una matriz de Jordan J de orden n, formada 
por mallas de Jordan, definidas del modo siguiente: a cada divisor 
elemental (A — A)" de la matriz A ponemos en correspondencia 
la malla de Jordan de orden k;j que corresponde al número A. Es 
evidente, que los polinomios (10), y sólo éstos, son los factores inv: 
riantes de la matriz J — AE distintos de la unidad. Por esto, li 
matrices A — AE y J — }E son equivalentes y, por consiguiente, 
la matriz A es semejante a la matriz de Jordan J. 


Ejemplo. Sea dada la matriz 
46 —17 87 —108 
8 9—42 M 

al ES 
Aa 6 —8 

Meduciendo la matriz A — }Ẹ de un modo ordi 


nemos que los factores invariantes de esta matı 
los polinomios 


ario a la forma canónica, obte- 
z, distintos de la unidad, son 


e«0)-A=01 1412), 
e0)=%=1. 


Vemos, pues, que la matri 
el campo de los numeros r: 
01241 yA 


A so reduce a la forma normal de Jordan incluso en 
ionales, Sus divisores elementales son los polino 
. por lo cual, la matriz 


110.0 

010.0 
y 

0o01 0 

000-2 


normal de Jordan de la matriz A. 
ramos hallar la matriz no degene 
z J, tendríamos que valernos de las indicacion 
párrafo precedento. 


forma la matriz A 
hechas al fin al del 


inalmente, basándose en los resultado 
demostrar la siguiente condición necesaria y suficiente de reduc: 
de una matriz a la forma diagonal, condición de la que inmedia 
mente se desprende el criterio suficiente de reducción a la forma 
diagonal, demostrado en el $ 33. 


teriores, se puede 
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Una matriz A de orden n con elementos del campo P, se reduce a la 
forma diagonal si, y sólo si, todas las raices del último factor invariante 
€n (A) de su matriz característica pertenecen al campo P, no teniendo 
que haber múltiples entre ellas. 

En efecto, la reducción de una matriz a la forma diagonal es 
equivalente a la reducción a una forma de Jordan, en la que las ma- 
las de Jordan sean de orden 1. En otras palabras, todos los divisores 
elementales de la matriz A tienen que ser polinomios de primer 
grado. Pero, como todos los factores invariantes de la matriz A — AE 
son divisores del polinomio e, (å), esta última condición equivale 
a que todos los divisores elementales del polinomio e, (2) sean de 
grado 1, como se quería demostrar. 


$ 62. Polinom 


Sea dada una matriz cuadrada A de orden z con elementos del 
campo P. Si 


mínimo 


10) = aA" aAa 


es un polinomio del anillo PIA), Ja ma 


fA) =A" p aA na E 


se lama valor del polinomio f (2) para A = A; advirtamos que, 
en este caso, el término independiente del polinomio f (2) se multi- 
plica por la potencia cero de la matriz A, o sea, por la matriz uni- 
dad E 


Fácilmente se comprueba que, si 
HORLOGES LON 
o si 
()=4 Avà) 
entonces, 


HA) =P (4) + (4) 
o, respectivamente, 
{(4)=u {A)v (A)- 
Si la matriz A anula al polinomio f (à), o sea, si 
1(4)=0, 
la matriz A se llamará raíz matricial, o bien, cuando esto no dé lugar 
a confusiones, se llamará simplemente raíz del polinomio f (A). 
Toda matriz A es raíz de un polinomio no nulo. 


En efecto, sabemos que todas las matrices cuadradas de orden 
n forman sobre el campo P un espacio vectorial de n? dimensiones. 
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De aquí se deduce, que el sistema de n? + 1 matrices 
ANA ta E 


es linealmente dependiente sobre el campo P, o sea, en P existen 
unos elementos &o, Lp, - + ++ Ona, Cnz+4, NO Simultáneamente iguales 
a cero, tales, que 

LA” +04” «HAMA + Anty E =0. 


Por lo tanto, resulta que la matriz A es raíz del polinomio 
no nulo 


aat 


PA= a 


cuyo grado no es superior a n?. 

La matriz A también es raíz de algunos polinomios cuyos coefi- 
cientes superiores son iguales a la unidad: es suficiente tomar cual- 
quier polinomio. distinto de cero que se anule por la matriz A, 
y dividirlo por su coeficiente superior. El polinomio de menor grado 
con el coeficiente superior igual a 1 que se anula por la matriz A, 
se llama polinomio mínimo de la matriz A. Obsérvese, que el polino- 
mio mínimo de la matriz A se determina univocamente, puesto que la 
diferencia de dos polinomios de éstos sería de menor grado que cada 
uno de los mismos y se anularía también por la matriz A. 

Todo polinomio f (2) que se anula por la matriz A, es divisible por 
el polinomio mínimo m (À) de esta matriz. 

En efecto, si 


+ And + Ant 


10)=090)40)+r 0), 
donde el grado de r(A) es menor que el grado de m(}), se tiene 
H(4)=m(4)9(4) +r(4) 


y como f (4) = m (A) = 0, resulta, r (4) = 0, lo cual contradice 
a la definición del polinomio mínimo. 

Demostremos ahora el siguiente teorema: 

El polinomio mínimo de una matriz A coincide con el último factor 
invariante e, (9) de la matriz característica A — 1E. 

Demostración. Conservando las notaciones y aplicando los resul- 
tados del $ 59, se puede escribir la igualdad 


(= 1)" ] A—2E |= ds (0) en (2). o 


En particular, de aquí se deduce que los polinomios e, (2) y dn- (2) 
no son nulos. Designemos ahora con B (4) la matriz adjunta a la 
matriz A — AE (véase el $ 14), 


B(2) =(AAE)*. 
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Como se deduce del $ 44 (igualdad (3), se cumple la igualdad 
(AE) B ()=|A—2E| E. ©) 


Por otra parte, como los menores de (n — 1)-ésimo orden de la 
matriz A — ÀE, tomados con los signos más o menos, y sólo éstos, 
son elementos de la matriz B (à), y el polinomio d,~; (A) es el máxi- 
mo común divisor de todos estos menores, se tiene: 


BM) = dn~: (4) € (à), (3) 


en donde el máximo común divisor de los elementos de la matriz 
C (2) es igual a 1. 
Pero, de las igualdades (2), (3) y (1), se deduce la igualdad 


(AAE) ds (A) C (2) = (— 1)" da-s (2) en (0) E- 


Esta igualdad se puede simplificar por el factor no nulo da- (À), lo 
cual se deduce de la siguiente observación general: si p (A) es un 
polinomio no nulo, y D (2) = (dı; (à)) es una A-matriz no nula, 
donde suponemos que ds: (4) + 0, entonces, en la matriz p (A) D (A), 
en el lugar (s, 1) figurará el elemento q (à) ds: (A), distinto de cero. 
Por lo tanto, 
(A—ME)C (A) =(— 1)" en (à) E, 

de dondo 

en (A) E = AE — A) 1)" C 0) (4) 


Esta igualdad muestra que el residuo de la división «a la izquier- 
da» de la A-matriz que figura en el primer miembro por el binomio 
AE — A, es igual a cero. Sin embargo, del lema demostrado al final 
del $ 60'se deduce que este residuo es igual a la matriz e, (A) E = 
a (4). En efecto, la matriz en (4) E se puede escribir en forma 
de un A-polinomio matricial cuyos coeficientes son matrices escala- 
res, o sea, son conmutables con la matriz A. Por lo tanto, 


en(4)=0, 
o sen, el polinomio e, (2) verdaderamente se anula por la matriz A. 


De aquí se deduce, que el polinomio e, (4) es divisible por el 
polinomio mínimo m (à) de la matriz A, 


en 0)=m(0)9 (0). 6 


Está claro, que el coeficiente superior del polinomio q (À) es igual 


a la unidad. 
Como m (4) —0, de nuevo, en virtud del mismo lema del $ 60, 


el residuo de la división «a la izquierda» de la A-matriz m (A) E por 
el binomio ÀE — A, es igual a cero, o sea, 


m0) E=0.E—A)0 0) (6) 
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Las igualdades (5), (4) y (6) nos llevan a la igualdad 
QE— A) (— 19€ ()1=AE—AJ1Q 0) q Ò). 
Ambos miembros de esta igualdad se pueden simplificar por 


el factor común A£ — A, pues, el coeficiente superior Æ de este 
A-polinomio matricial es una matriz no degenerada. Por lo tanto, 


C()=(-1""0 (A) g A). 
Recordemos, sin embargo, que el máximo común divisor de los 
elementos de la matriz C (2) es igual a 4. Por esto, el polinomio 


q (à) tiene que ser de grado cero, y como su coeficiente superior 
es igual a 1, resulta, q (4) 1. Por lo tanto, en virtud de (5), 


e 0)=m0), 


«ue es lo que se quería demostrar. 

Como, en virtud de (1), el polinomio característico de la matriz 
A es divisible por el polinomio e, (A), del teorema que acabamos 
de demostrar se desprende el siguiente 

Teorema de Hamilton-Cayley. Toda matriz es raíz de su polino- 
mio característico 

Polinomio mínimo de una transformación lineal. Demostremos 
primero la siguiente proposición: 

Si las matrices A y B son semejantes y la matriz A anula al poli- 
nomio f (À), entonces, la matriz B también anula al mismo. 

En efecto, sea 


Si 
S.T E ts 1-0, 
so tiene 
ata a A E 0. 
Transformando ambos miembros de esta igualdad con la matriz C, 
obtenemos: 
CaA HA A E) O 
(CACA a (CAC no. Haaa (07 AC) 09 E 


- mB" taB" 


0.808 0, 
o sea, f (B) — 0. 

De aquí se deduce, que las matrices semejantes poseen un mismo 
polinomio minimo. 

Supongamos ahora que q es una transformación lineal del espacio 
lineal de n dimensiones sobre el campo P. Las matrices que deter- 
minan esta transformación en distintas bases del espacio, son seme- 


20-252 
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jantes entre sí. El polinomio mínimo común de estas matrices se 
llama polinomio mínimo de la transformación lineal y. 

Aplicando las operaciones sobre las transformaciones lineales, 
introducidas en el $ 32, se puede introducir el concepto de ralor 
de un polinomio 


10) = aoh" + ad 


del anillo P(A] para 2, igual a una transformación lineal «y: este 
valor será la transformación lineal 


10) =000 + ay! 


donde e es la transformación idéntica. 
Diremos Juego que la transformación lineal q anula al poli- 
nomio F (A), si 


+ Anh + On 


Op + O, 


I=, 
donde w es la transformación nula, 

Teniendo en cuenta la relación existente entre las operaciones 
sobre las transformaciones lineales y sobre las matrices, el lector 
demostrará sin dificultad alguna, que el polinomio mínimo de una 
transformación lineal q es el polinomio de menor grado con el coefi- 
ciente superior 4, determinado unívocamente, que se anula por la trans- 
formación . Después de esto, los resultados obtenidos anteriormente 
y, en particular, el teorema de Hamilton-Cayley, se pueden enunciar 
de nuevo en términos de transformaciones lineales. 


CAPITULO XIV 
GRUPOS 


$ 63. Definición y ejemplos de grupos 


Los anillos y los cuerpos, que desempeñaron un papel tan grando 
en los capítulos anteriores, son sistemas algebraicos de dos opera- 
ciones independientes: adición y multiplicación. Sin embargo, en 
diversas ramas de las matemáticas y en sus aplicaciones, frecuente- 
mente se encuentran tales sistemas algebraicos, en los que está 
definida una sola operación algebraica. Así, pues, limitándonos por 
ahora a los ejemplos que ya aparecieron en nuestro libro, señalemos, 
que en el conjunto de las sustituciones de grado n (véase el $ 3), 
solamente habíamos definido una operación: la multiplicación. 
Por otra parte, en la definición del espacio vectorial ($ 8) está inclui 
da la suma de vectores, mientras que el producto de vectores no 
había sido definido (señalemos, que el producto de un vector por 
un número no satisface a la definición de operación algebraica dada 
on el $ 44). 

Un tipo importante de sistemas algebraic 
son los grupos. Este concepto posee un campo e 
amplio de aplicaciones y representa el objeto de una gran ciencia 
independiente, de la teoría de los grupos. El capítulo presente puede 
considerarse como introducción a la teoría de los grupos: en él se 
expondrán las nociones elementales sobre los grupos, cuyo cono 
cimiento es necesario para cada matemático; el capítulo se termi- 
nará con la exposición de un teorema menos elemental. 

De acuerdo a la teoría general de los grupos, convengamos en lla- 
mar multiplicación a la operación algebraica considerada y en emple- 
ar los símbolos correspondientes. Recordemos (véase el $ 44), que 
se supone que siempre es posible la operación algebraica, y que ésta 
es univalente: para cualquier par de elementos a y b del conjunto 
considerado, existe el producto ab y representa un elemento uní- 
vocamente determinado de este conjunto. 

Se llama grupo a un conjunto G con una operación algebraica, 
que es asociativa (aunque no necesariamente conmutaliva), y para 
la que existe además la operación inversa. 


con una operación 
traordinariamente 


26° 
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Como la operación en el grupo puede ser no conmutativa, la 
existencia de la operación inversa significa lo siguiente: para cual- 
quier par de elementos a y 6 de G, existe en G un elemento z y un 
elemento y, unívocamente determinados, tales que 

ar=b, ya=b. 

Si el grupo G se compone de un número finito de elementos, se 
denomina grupo finito, y el número de sus elementos, se llama 
orden del grupo. Si la operación definida en el grupo es conmutativa, 
G se denomina grupo conmutativo o abeliano, 

Señalemos las consecuencias elementales de la definición de 
grupo. Basándose en los razonamientos expuestos ya en el $ 44, 
se puedo afirmar que la ley asociativa nos permite hablar de un 
modo univoco del producto de un número finito cualquiera de ele- 
mentos del grupo, dados en un orden determinado (ya que la opera- 
ción en el grupo puede ser no conmutativa). 

Veamos las consecuencias de la existencia de la operación inversa. 

Supongamos que en el grupo G se ha dado un elemento arbitra- 
rio a. De la definición del grupo se deduce la existencia en G de un 
elemento e,, univocamente determinado, tal que ae, por 
consiguiente, este elemento desempeña el papel de la unidad al 
multiplicar el elemento a por él a la derecha. Si b es otro elemento 
cualquiera del grupo G, y si y es el elemento del grupo que satisface 
a la igualdad ya = b, cuya existencia se deduce de la definición 
del grupo, se tiene: j 

b = ya = y (aea) = (Y) €a = bea. 
Por lo tanto, el elemento e, desempeña el papel de unidad a la derecha 
con respecto a todos los elementos del grupo G y no sólo con respecto 
al elemento inicial a; por eso, lo designaremos mediante e”. De la 
unicidad, que forma parte do la definición de la operación inversa, 
se deduce la unicidad de este elemento. 

De este mismo modo se puede demostrar la existencia en G y la 
unicidad de un elemento e” que satisfaga a la condición e”a = a 
para todos los elementos a de G. En realidad, los elementos e” y e” 
coinciden, puesto que de las igualdades ee” = e" y ee = e se 
deduce que e” = e”. De esta manera, queda demostrado que en cada 
grupo G existe un elemento e, univocamente determinado, que satisface 
a la condición: 


ae=ea 


para todos los elementos a de G. Este elemento se lama unidad 
del grupo G y se designa ordinariamente con el símbolo 4. 
Para cada elemento dado a, de la definición del grupo se deduce, 


la existencia y unicidad de unos elementos a” y a” tales, que 
ad =1, at. 
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En la realidad, los elementos a” y a” coinciden: de las igualdades 


se deduce que “a” Este elemento se llama inverso del ele- 
mento a y se designa con la notación a, de modo que 


aral. 


Por lo tanto, cada elemento del grupo posee un elemento inverso, unf- 
vocamente determinado. 

De las últimas igualdades se deduce, que el mismo elemento 
a sirve de inverso para el elemento a™. Es fácil observar también, 
que el inverso del producto de unos cuantos elementos es el producto 
de los elementos inversos de los factores y, además, tomados en 
orden inverso: 


CA E EN 


Por fin, el elemento inverso de la unidad es la unidad misma. 

La prueba para averiguar si un conjunto dado con una operación 
es grupo o no, se facilita sumamente por el hecho de que en la defi- 
nición de grupo la demanda del cumplimiento de la operación inver- 
sa se puede sustituir por la suposición de la existencia de la unidad 
y de los elementos inversos y, además, sólo por un lado (por ejem- 
plo, por la derecha) y sin suponer la unicidad de ellos. Esto se 
deduce del siguiente teorema: 

Un conjunto G con una operación asociativa es grupo, si en él existe 
por lo menos un elemento e que posee la propiedad: 


ae=a para todos los elementos a de G, 


y si entre todos los elementos unidades a la derecha existe por lo menos 
un elemento es tal, que con respecto a él cada elemento a de G posee 
por lo menos un elemento inverso a la derecha a“t: 

1 


ad” 


eo. 
Demostración. Sea a uno de los elementos inversos a la derecha 
de a. Entonces, 
aa? = eg = yt = eoa}, 


o sea, aa”! = eyaa”!. Multiplicando a la derecha ambos miembros 
de esta igualdad por uno de los elementos que son inversos a la dere- 
cha de a”!, obtenemos, ae, = ey aeo, de donde a = eya, puesto que 
es es una unidad a la derecha de G. Por lo tanto, resulta que el ele- 
mento es es también una unidad a la izquierda de G. Si ahora e, es 
una unidad a la derecha arbitraria y ez es una unidad a la izquierda 
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arbitraria, de las igualdades 
ex1 =e, y Coty =en 


se deduce que e, — e», o sea, que cualquier unidad a la derecha es 
igual a cualquier unidad a la izquierda. Queda, pues, demostra- 
da la existencia y unicidad en el conjunto G del elemento unidad, 
me lo indicaremos, como anteriormente, mediante 1. 

Luego, 


a at. i=ataat, 


es decir, at = a“! aa, donde a”! es uno de los elementos inversos 
a la derecha de a. Multiplicando a la derecha ambos miembros de 
la última igualdad por uno de los elementos inversos a la derecha 
de a”, obtenemos, 1 = a7l a, o sea, que el elemento a™ sirve tam- 
bién de elemento inverso a la izquierda de a. Si ahora az! es un ele- 
mento inverso a la derecha arbitrario de a, y az! es un elemento 
inverso a la izquierda arbitrario del mismo, de las igualdades 


aaa! = (a;*a) a =a 7, 


az maz! =az (aa; 


e deduce que a;' = az, es deci educe la existencia y la uni 
dad, para cada elemento a de G, del elemento inverso a 

Ahora es fácil mostrar que el conjunto G es grupo. En efecto, 
como bien se obverva, las ecuaciones az = b, ya = b se satisfacen 
con los elementos 


La unicidad de esta 
az, — az», multiplicando a la izquierda ambos miembros de est 
igualdad por a-t, obtenemos 7, — z2. El teorema queda demostrado. 

Ya nos hemos encontrado unas cuantas veces con el concepto 
de isomorfismo: para los anillos, para los espacios lineales, para 
los espacios euclídeos. Este concepto puede ser definido también 
para los grupos y desempeña en la teoría de los mismos un papel 
tan importante como en la teoría de los anillos. Se dice que los grupos 
G y G' son isomorfos, si se puede establecer entre ellos una correspon- 
dencia biunívoca tal, que para cualquier par de elementos a y b 
de G y para sus correspondientes elementos a” y b' de G’, al producto 
ab corresponde el producto a'b’. Del mismo modo que en el $ 46 
(para el cero y para el elemento opuesto del anillo), se puede demos- 
trar que, en la correspondencia isomoría de los grupos G y G’, a la 
unidad del grupo G corresponde la unidad del grupo G', y si al ele- 
mento a de G le corresponde el elemento a” de G’, al elemento a? 
le corresponderá el elemento a”. 
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Pasando a examinar ejempolos de grupos, señalemos que, si la 
operación en el grupo se llamase suma, la unidad del grupo se lama- 
ría cero y se indicaría con la notación O, y en lugar de elemento 
inverso diríamos elemento opuesto y lo indicaríamos mediante —a. 

Como primer ejemplo de grupo, anotemos que, respecto a la suma, 
cualquier anillo (y, en particular, un cuerpo) representa un grupo, 
y además, abeliano; éste es el llamado grupo aditivo del anillo. Esta 
observación proporciona inmediatamente una gran cantidad de ejem- 
plos concretos de grupos, y entre ellos: el grupo aditivo de números 
enteros, el grupo aditivo de números pares, los grupos aditivos de 
números racionales, de números reales, de números complejos, etc, 
ete. Señalemos, que los grupos aditivos de números enteros y de núme- 
ros pares son isomorjos entre sí, a pesar de que el segundo forma sólo 
una parte del primero: la transformación que pone en correspondencia 
a cada número entero k el número par 2k, es biunívoca y, como fácil- 
mente se puede comprobar, representa una transformación isomorfa 
del primero de los grupos nombrados sobre el segundo. 

Ningún anillo es grupo respecto a la multiplicación, puesto que 
no siempre se cumple la operación inversa, que es la división. No 
cambia el asunto al pasar de un anillo arbitrario a un cuerpo, puesto 
«ue en éste se mantiene sin cumplir la división por cero. Examine- 
mos, sin embargo, el conjunto de todos los elementos del cuerpo 
diferentes de cero. Como el campo no contiene divisores de cero, es 
decir, que el producto de dos elementos diferentes de cero tamb: 
es diferente de cero, la multiplicación representa una operación 
algebraica para el conjunto considerado, que es asociativa y con- 
mutativa, siendo posible ya la división sin salir fuera de los límites 
de este conjunto. Por lo tanto, el conjunto de todos los elementos 
dliferentes de cero de cualquier campo representa un grupo abelian 
éste se llama grupo multiplicativo del campo. Ejemplos concernientes 
esto son: los grupos multiplicativos de números racionales, de 
números reales, de números complejos. 

Es evidente que, respecto a la multiplicación, todos los números 

vales positivos forman grupo. Este grupo es isomorfo al grupo adi- 
tivo de todos los números reales: poniendo en correspondencia a cada 
úmero positivo a el número real In a, obtenemos una aplicación 
yectiva del primero de los grupos sobre el segundo, que representa 
un isomorfismo en vista de la igualdad, 


In (ab) = In a + In b. 


Tomemos, ahora, en el campo de los números complejos, el con- 
junto de las raíces n-ésimas de la unidad. En el $ 19 se había demos- 
trado que el producto de dos raíces n-ésimas de la unidad, así como 
el número recíproco de la raíz n-ósima de la unidad, pertenecen al 
mismo conjunto considerado de números. Como la unidad también 
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pertenece, naturalmente, a este conjunto, y como la multiplica- 
ción de cualesquiera números complejos es asociativa y conmutativa, 
obtenemos que las raíces n-ésimas de la unidad forman un grupo 
abeliano respecto a la multiplicación; este grupo es finito y de orden n. 
Por lo tanto, para cualquier número natural n, existen grupos finitos 
de orden n. Ñ 

El grupo (respecto a la multiplicación) de las raíces n-ésimas de 
la unidad es isomorfo al grupo aditivo del anillo Z, construido en el 
$ 45. En efecto, si e es una raíz primitiva de orden n de la unidad, 
todos los elementos del primero de los grupos considerados tienen 
la forma æ", k = 0, 1, . . ., r — 1. Si ponemos en correspondencia 
a cada número e” el elemento C, del llo Zn, o sea, la clase de 
números enteros cuyos residuos, al dividirlos por n, son iguales a k, 
obtenemos una correspondencia de isomorfismo entre los grupos 
considerados: si O<k<n—1, 0<lén—1 y si k+l 

nq + r, donde O<r.<n —4, y q es igual a O ó a 1, entonces, 
etel + ey, a la vez, Ca + Ci = Cre 

Es oportuno señalar ahora unos cuantos ejemplos de conjuntos 
numéricos que no forman grupo. Así, el conjunto de todos los núme- 
ros enteros no forma grupo respecto a la multiplicación, el conjunto 
de todos los números reales positivos no forma grupo respecto a la 
suma, el conjunto de todos los números impares no forma grupo 
respecto a la suma, el conjunto de todos los números reales nega- 
tivos no forma grupo respecto a la multiplicación. No representa 
dificultad alguna la comprobación de todas estas afirmaciones. 

Naturalmente, todos los grupos numéricos examinados anterior- 
mente son abelianos. Los espacios lineales sirven de ejemplos de 
grupos abelianos que no están formados por números: como se deduce 
de su definición (véase los $$ 29, 47), todo espacio lineal sobre 
un cuerpo arbitrario P es grupo abeliano respecto a la operación de 
la suma. 

Veamos algunos ejemplos de grupos uo conmutativos. 

El conjunto de todas las matrices de orden n sobre un campo P 
no representa grupo respecto a la operación de multiplicar, ya que 
no se cumple la condición de existencia del elemento inverso. Sin 
embargo, si nos limitamos sólo a las matrices que no son degene- 
radas, se obtiene ya un grupo. En efecto, como sabemos, el producto 
de dos matrices no degeneradas es una matriz no degenerada, la 
matriz unidad tampoco es degenerada, toda matriz no degenerada 
posee matriz inversa, que tampoco es degenerada, y, por fin, la ley 
asociativa, cumpliéndose para todas las matrices, se cumple, par- 
ticularmente, para las matrices no degeneradas. Por consiguiente, 
se puede hablar del grupo de las matrices no degeneradas de orden n 
sobre el cuerpo P, tomando por operación en el grupo el producto 
de las matrices; este grupo no es conmutativo para n>2. 
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El producto de sustituciones, definido en el $ 3, da lugar a ejem- 
plos muy importantes de grupos finitos no conmutativos. Ya sabe- 
mos que, en el conjunto de todas las sustituciones de grado n, la 
multiplicación representa una operación algebraica, que es, además, 
asociativa, aunque para n>3 no es conmutativa; también sabemos 
que la sustitución idéntica Æ sirve de unidad en esta multiplica- 
ción y que para cualquier sustitución existe la sustitución inversa, 
Por lo tanto, el conjunto de las sustituciones de grado n forma grupo 
respecto a la multiplicación, que es además finito y de orden n!. Este 
se lama grupo simétrico de grado n, y para n>3 no es conmutativo. 

En lugar de examinar el conjunto de sustituciones de grado n, 
consideremos ahora solamente el conjunto de las sustituciones 


pares, compuesto, como ya sabemos, de -+ n! elementos. Aplicando 


el teorema demostrado en el $ 3, según el cual la paridad de la 
sustitución coincide con la paridad del número de trasposiciones 
que forman parte en cualquiera de las descomposiciones de esta 
sustitución en producto de trasposiciones, se obtiene, que el pro- 
ducto de dos sustituciones pares es una sustitución par; en electo, la 
descomposición de AB en forma de un producto de trasposiciones 
se obtiene yuxtaponiendo las descomposiciones correspondientes 
de A y B. Ya se sabe que es asociativa la multiplicación de susti- 
tuciones; es evidente, que la sustitución idéntica es par. Por fin, 
es par la sustitución A~}, si es par la sustitución A; esto es debido 
aunque sólo sea al hecho de que las expresiones de estas sustituciones 
se pueden obtener una de otra permutando de sitio las filas superior 
e inferior, o sea, que ellas contienen igual número de inversiones. 
Por consiguiente, el conjunto de las sustituciones pares de n grado 
representa un grupo finito respecto a la multiplicación, de orden + n. 
Este se llama grupo alternado de grado n; es fácil comprobar que 
este grupo no es conmutativo para n>4, a pesar de que es con- 
mutativo para n = 3. 

Los grupos simétrico y alternado desempeñan un gran papel en 
la teoría de los grupos finitos y también en la teoría de Galois. 
Señalemos que, por analogía con los grupos alternados, sería impo- 

ble construir con las sustituciones impares un grupo respecto 
a la multiplicación, puesto que el producto de dos sustituciones 
impares siempre es una sustitución par. 

Las diversas ramas de la geometría proporcionan numerosos 
ejemplos de grupos distintos. Indiquemos un ejemplo sencillo de 
este género: el conjunto de todas las rotaciones de una esfera alre 
dedor de su centro representa un grupo, pero no conmutativo, si e: 
que llamamos producto de dos rotaciones al resultado de su realiza- 
ción consecutiva. 
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Un subconjunto A de un grupo G se llama subgrupo de éste si él 
mismo representa un grupo respecto a la operación definida en el 
grupo G. 

Para verificar que el subconjunto A del grupo G forma un sub- 
grupo de este grupo, es suficiente comprobar: 1) si contiene A el 
producto de dos elementos cualesquiera de A; 2) si contiene A, 
junto con cada uno de sus elementos, el elemento inverso. En efecto, 
del cumplimiento de la ley asociativa en el grupo G se deduce su 
cumplimiento para los elementos de A, y la pertenencia de la unidad 
del grupo G a A es consecuencia de 2) y 1). 

Muchos de los grupos señalados en el párrafo anterior representan 
subgrupos de otros grupos indicados allí mismo. Así, el grupo adi- 
tivo de los números pares representa un subgrupo del grupo aditivo 
de los números enteros, y este último a su vez es un subgrupo del 
grupo aditivo de los números racionales. Todos estos grupos, como 
en general los grupos aditivos de números representan subgrupos 
del grupo aditivo de los números complejos. El grupo multiplica- 
tivo de los números reales positivos representa un subgrupo del 
grupo multiplicativo de todos los números reales diferentes de cero. 
ìl grupo alternado de grado n es un subgrupo del grupo simétrico 
del mismo grado. 

Subrayemos, que la condición que figura en la definición de 
subgrupo, de que el subconjunto A del grupo G sea grupo respecto a la 
operación definida en el grupo G. es esencial. Así, el grupo multi- 
plicativo de los números reales positivos no representa un subgrupo 
del grupo aditivo de todos los números reales, a pesar de que el 
primer conjunto está contenido en el segundo como subconjunto. 

Si en el grupo G se han tomado los subgrupos A y B, su intersec- 
ción A fB, es decir, el conjunto de los elementos pertenecientes a A y 
a B, también es un subgrupo del grupo G. 

En efecto, si los elementos z e y pertenecen a la intersección 
ANB, estos pertenecen al subgrupo A, y por eso, el producto zy 
y el elemento inverso z“? también pertenecen a A. Por las mism: 
razones, los elementos xy y x7* pertenecen también al subgrupo B, 
y por eso, éstos pertenecen también a A f) B. 

Como fácilmente se ve, el resultado obtenido no sólo es justo para 
dps grupos, sino que también lo es para un número cualquiera de 
subgrupos, finito e incluso infinito. 

El subconjunto del grupo G formado por el solo elemento 1, 
representa, evidentemente, un subgrupo de este grupo; este sub- 
grupo, que está contenido en cualquier otro subgrupo del grupo G, 
se lama subgrupo unidad del grupo G. Por otra parte, el mismo gru- 
po G representa uno de sus subgrupos. 
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Los llamados subgrupos cíclicos sirven de ejemplos interesantes 
de subgrupos. Introduzcamos primero el concepto de potencia de un 
elemento a de un grupo G. Siendo n un número natural arbitrario, 
el producto de n elementos iguales al elemento a se llama potencia 
del elemento a de grado n y se indica mediante a”. Las potencias 
negativas del elemento a se pueden determinar, bien como elementos 
del grupo G, inversos a las potencias positivas de este elemento, 
o bien como el producto de unos cuantos factores, iguales al ele- 
mento a”! En la realidad, estas definiciones coinciden: 

("y'= (a)", n>0. (1) 
Para la demostración, es suficiente tomar el producto de 2n factores, 
de los cuales, los n primeros sean iguales a a y los demás, a a”, 
y efectuar todas las simplificaciones. El elemento igual a ambos 
miembros de la igualdad (1), se indicará mediante a”. Convengamos, 
por fin, en entender por la potencia cero a” del elemento a, el elemen- 
mento 1. 

Obsérvese, que si la operación en el grupo G se llama suma, 
en lugar de las potencias del elemento a se debe hablar de los múl- 
tiplos de este elemento, esc 'ndolos mediante ka. 

Fácilmente se comprueba que en cualquier grupo G, para las 


potencias de cualquier elemento a con cualesquiera exponentes m 
y n, positivos, negativos o ceros, se verifican las igualdades: 

E =a" -a" = anm, (2) 

(a")" =a 68) 


Designemos con (a) el subconjunto del grupo G formado por 
todas las potencias del elemento a; el mo elemento a también 
está incluido en él, representando la primera potencia. El subcon- 
junto {a} es un subgrupo del grupo G: el producto de elementos de 
{a} pertenece a {a}, en virtud de (2); el elemento 1, igual a a°, per- 
tenece a (a) y, por fin, (a) junto con cada elemento suyo contiene 
al elemento inverso, puesto que de (3) se deduce la igualdad 

(a”) 

El subgrupo (a) se llama subgrupo cíclico del grupo G, engendrado 
por el elemento a. Como muestra la igualdad (2), este subgrupo 
siempre es conmutativo, incluso cuando el mismo grupo G no sea 
conmutativo. 

Señalemos, que anteriormente no se había afirmado nunca que 
todas las potencias del elemento a son diferentes elementos del 
grupo. Si esto es verdaderamente así, entonces a se llama elemento 
de orden infinito. Sin embargo, supongamos que entre las potencias 
del elemento a haya algunas iguales, por ejemplo, a" = al siendo 
k l; esto siempre tiene lugar en el caso de grupos finitos, pero puede 


ar. 
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o. Si k> l, se tiene 
k 
es decir, existen potencias positivas del elemento a que son iguales 


a la unidad. Supongamos que z es la potencia positiva menor del 
elemento a, que es igual a la unidad, o sea, que 


1) a*"=1, n>0, 
2) si a"=1, k>0, en 


ocurrir también en un grupo in 


ql 


aces kn. 


En este caso, se dice que a es un elemento de orden finito, precisa- 
mente, de orden n. 

Es fácil observar que 
los elementos 


el elemento a es de orden finito z, todos 


a 0) 


. Cualquiera otra potencia del elemento a, positiva o nega- 
elementos (4). En efecto, si k es un número 
ndolo por z se obtiene: 


k=ng+r, 0<r<n, 


son diferente: 
tiva, es igual a uno de los 
entero arbitrario, i 


y, por eso, en virtud de (2) y (3), 
a" = (a")1 a" = a". (5) 
De esto se deduce que, si el elemento a es de orden finito 
n y a"=—1, entonces k se divide por n. Por otra parte, como 
—1=n(—1)+(n—1) 


para el elemento a de orden finito n, 
a-t =a 


Como el sistema (4) contiene n elementos, de los resultados obte- 
nidos anteriormente se deduce que, para un elemento a que tiene orden 
finito, su orden n coincide con el orden (o sea, con el número de los 
elementos) del subgrupo cíclico (a). 

Señalemos, por fin, que todo grupo posee un elemento único de 
primer orden: éste es el elemento 1. Es evidente, que el subgrupo 
cíclico (1) coincide con el subgrupo unidad. 

Grupos cíclicos. Un grupo G se llama cíclico si se compone de 
las potencias de uno de sus elementos a, es decir, que coincide con 
uno de sus subgrupos cíclicos (a); en este caso, a se llama elemento 
generador del grupo G. Es evidente, que todo grupo cíclico es abeliano. 

El grupo aditivo de los números enteros sirve de ejemplo de grupo 
cíclico infinito, pues todo número entero es múltiplo de 1, es decir, 
que este número es el elemento generador del grupo considerado; 
se podría tomar también como elemento generador el número —1. 
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El grupo multiplicativo de las raíces de grado n de la unidad 
sirve de ejemplo de grupo finito cíclico de orden n, pues, como se 
había mostrado en el $ 19, todas estas raíces son potencias de una 
de ellas, que es, precisamente, la raíz primitiva. 

El teorema que sigue muestra que, con estos ejemplos se agotan 
en la realidad todos los grupos cíclicos: 

Todos los grupos cíclicos infinitos son isomorfos entre sí; son isomor- 
fos entre sí también todos los grupos cíclicos finitos de un orden dado n. 

En efecto, resulta una aplicación biyectiva del grupo cíclico 
infinito, con el elemento generador a, sobre el grupo aditivo de los 
números enteros, al hacer corresponder a cada elemento a" del pri: 
mer grupo el número k; esta aplicación representa un isomorfismo, 
puesto que de acuerdo a (2), al multiplicar las potencias del ele- 
mento a se suman los exponentes. Si se da un grupo cíclico finito G 
de orden n, con el elemento generador a, entonces designando con € 
spa raíz primitiva de grado n de la unidad asociamos a cada elemento 

i" del grupo G el número e*, 0 < k < n. Esto representa una apli- 
cación biyectiva del grupo G sobre el grupo multiplicativo de las 
raíces de grado n de la unidad, cuyo isomorfismo se deduce de 
(2) y (5). 

Este teorema da la posibilidad de hablar simplemente del grupo 
ciclico infinito, o bien del grupo cíclico de orden n. 

Demostremos ahora el teorema siguiente: 

Todo subgrupo de un grupo cíclico es cíclico, 

En efecto, sea G- (a) un grupo cíclico con el elemento gene- 
rador a, finito o infinito, y sea A un subgrupo del grupo G. Se puede 
suponer que A es diferente del subgrupo unidad, pues, en caso con- 
trario, no habría que demostrar nada. Supongamos que a" 
potencia positiva mínima del elemento 4, contenida en / 
potencia existe, puesto que si A contiene el elemento a, s >O, 
diferente de 1, contiene también el elemento a, inverso de él. Supon- 
gamos que A contiene también al elemento al, 120, y que Z no es 
divisible por k. Entonces, si dtd > 0, es el máximo común divisor 
de los números k y Z, existen unos números enteros u y v tales, que 


ku 


lv=d, 


y por eso, el subgrupo A tiene que contener al elemento 
(al)"(aty al 


pero como por la hipótesis d £ k, llegamos a una contradicción 
E la elección del elemento a”. Con esto, queda demostrado que 
= qa"). 
Descomposición de un grupo en clases con relación a un subgrupo. 
Tomando en el grupo G los subconjuntos M y N, por producto MN 
de ellos se entiende el conjunto de los elementos del grupo G que se 
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pueden representar, aunque sólo sea de un modo, en forma de un 
producto de un elemento de M por un elemento de N. Del cumpli- 
miento de la ley asociativa para la operación en el grupo se deduce 
su cumplimiento para la multiplicación de los subconjuntos del grupo: 


(MN)P=M (NP). 


Naturalmente, uno de los conjuntos M, N puedo estar compuesto 
de un solo elemento a. En este caso, se obtiene el producto aN del 
elemento por el conjunto o el producto Ma del conjunto por el elemento. 

Supongamos que en el grupo G se ha dado un subgrupo arbitra- 
rio A. Si z es un elemento cualquiera de G, el producto zA se llama 
clase adjunta a la izquierda del subgrupo A en el grupo G, engendrada 
por el elemento x*. Es comprensible, que el elemento z está contenido 
en la clase adjunta xA, puesto que el subgrupo A contiene la unidad, 
yiz. 

Toda clase adjunta a la izquierda es engendrada por cualquiera de 
sus elementos, es decir, que si el elemento y pertenece a la clase 
adjunta z4, entonces, 


yA=xA. (6) 
En electo, y se puede representar en la forma 
y=xza, 


donde a es un elemento del subgrupo A. Por eso, para cuales- 
quiera elementos a’ y a” de A, se tiene 


ya =z (au), 
za =y(a ta”). 


con lo que queda deme la igual 

De esto se deduce que dos clases adjuntas a la izquierda cuales- 
quiera del subgrupo A en el grupo G, o coinciden, o no tienen ningún 
elemento común. En efecto, si las clases adjuntas zA e yA contienen 
un elemento común z, se tiene: 


zA=z4= yA. 


Por lo tanto, todo el grupo G se descompone en clases adjuntas 
a la izquierda, disjuntas respecto al subgrupo A. Esta descomposi- 
ción se llama descomposición del grupo G en clases a la izquierda respecto 
del subgrupo A. 

Adviértase que una de las clases adjuntas a la izquierda de esta des- 
composición coincide con el mismo subgrupo A; esta clase está 


* A veces, se llama clase de restos, clase residual o simplemente clase 
y también cogrupo. Para evitar confusiones, advirtamos, que un cogrupo nunca 
es un subgrupo, a excepción del cogrupo engendrado por el elemento unidad 
(o por cualquier elemento del subgrupo A) que coincide con el mismo subgrupo A. 
(Nota del T.). 
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engendrada por el elemento 1, o, en general, por cualquier elemento 
a de A, puesto que 
aA=A. 


Es obvio, que llamando al producto Ax clase adjunta a la derecha 
del subgrupo A en el grupo G, engendrada por el elemento x, de modo 
análogo obtendríamos la descomposición a la derecha del grupo G 
respecto del subgrupo A. Naturalmente, para un grupo abeliano, 
ambas descomposiciones, a la izquierda o a la derecha, respecto de 
cualquier subgrupo coinciden, es decir, se puede hablar simplemente 
de la descomposición del grupo respecto del subgrupo. 

Así, pues, la descomposición del grupo aditivo de los números 
enteros con respecto del subgrupo de los números que son múltiplos 
del número k, se compone de k clases residuales distintas, engendra- 
das por los números 0, 1,2, ..., k —1, respectivamente. En 
este caso, en la clase al,” engendrada por el número 
1,01 < k — 1, están comprendidos todos los números que al ser 
divididos por k dan el resto Z. 

Cuando el grupo no es conmutativ 
to de un subgrupo pueden ser dis 

Veamos, por ejemplo, el grupo simétrico de 3 grado Ss, donde, 
de acuerdo al $ 3, se escribirán sus elementos mediante ciclos. 
Tomemos en calidad de subgrupo A el subgrupo cíclico engendrado 
por el elemento (12); este subgrupo consta de la sustitución idéntica 
y de la sustitución (12) misma. Las otras clases adjuntas a la izquier- 
da son: la clase (13)-A, que se compone de las sustituciones (13) 
y la clase (23) -A, que se compone de las sustituciones (23) 
. Por otra parte, las clases adjuntas a la derecha relativas 
al subgrupo A son: el mismo subgrupo A, la clase A -(13), compuesta 
de las sustituciones (13) y (123), y la el A -(23), compuesta de las 
sustituciones (23) y (132). Vemos, pues, que en este caso, la descom- 
posición en clases a la derecha se diferencia de la descomposición 
en el a la izquierd 

En el caso de grupos finitos, la existencia de descomposiciones 
de un grupo en clases respecto de un subgrupo nos lleva al siguiente 
teorema importante: 

Teorema de Lagrange. En todo grupo finito, el orden de cualquier 
subgrupo es un divisor del orden del mismo grupo. 

En efecto, supongamos que en el grupo finito G de orden n se 
haya dado un subgrupo A de orden k. Consideremos la descompo- 
sición del grupo G en clases a la izquierda respecto del subgrupo A. 
Supongamos que ésta consta de j clases; el número j se llama índice 
del subgrupo A en el grupo G. Cada clase adjunta a la izquierda 24 
consta de k elementos, exactamente, puesto que si 


descomposiciones respec- 


TA, = tasn, 
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donde a, y az son elementos de A, entonces, a, =a. Por lo tanto, 
kj, Y) 


n 
que es lo que se queria demostrar- 

Comoel orden de un elemento coincide con el orden de su subgru- 
po cíclico, del teorema de Lagrange se deduce que el orden de cada 
elemento de un grupo finito es divisor del orden del grupo. 

Del teorema de Lagrange se deduce también, que todo grupo 
finito, cuyo orden es un número primo, es cíclico. En efecto, este 
grupo tiene que coincidir con el subgrupo cíclico engendrado por 
cualquiera de sus elementos, diferente de la unidad. En virtud de la 
descripción obtenida anteriormente de los grupos cíclicos, resulta 
que, para cualquier número primo p, existe solamente un grupo finito 
de orden p, salvo un isomorfismo. 
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Un subgrupo A de un grupo G se llama divisor normal de este 
grupo (o subgrupo invariante*), si la descomposición del grupo G 
en clases a la izquierda respecto del subgrupo A coincide con la 
descomposición correspondiente a la derecha. 

Por lo tanto, todos los subgrupos de un grupo abeliano son divi- 
sores normales del mismo. Por otra parte, en cualquier grupo G, 
el subgrupo unidad y el grupo mismo son divisores normales: 
ambas descomposiciones del grupo G en clases respecto del 
subgrupo unidad coinciden con la descomposición del grupo en 
elementos separados, ambas descomposiciones del grupo G en clases 
con respecto de este mismo grupo constan de una sola clase G. 

Señalemos unos ejemplos más interesantos de divisores normales 
en grupos no conmutativos. En el grupo simétrico de 3% grado Sy, 
el subgrupo cíclico del elemento (123), que consta de la sustitución 
idéntica y de las sustituciones (123) y (132), representa un divisor 
normal: en ambas descomposiciones del grupo S en clases con res- 
pecto de este subgrupo, la segunda clase adjunta consta de las susti- 
tuciones (12), (13) y (23). 

En general, en el grupo simétrico S„ de grado n, el grupo alter- 
nado A, de grado n es un divisor normal. En efecto, el orden del 
grupo A, es igual a Het, por lo cual, cada clase adjunta del subgru- 
po A, en el grupo S, tiene que estar constituida de la misma canti- 
dad de elementos y, por consiguiente, solamente existe una clase más 
de éstas, que es precisamente el conjunto de las sustituciones impares. 

En el grupo multiplicativo de las matrices cuadradas no degene- 
radas de orden n, cuyos elementos pertenecen al cuerpo P, las matri- 


* También se llama subgrupo normal, o subgrupo distinguido. (Nota del T.). 
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ces, cuyos determinantes son iguales a 1, forman, evidentemente, 
un subgrupo. Este es, incluso, un divisor normal, puesto que las 
clases adjuntas a la derecha y a la izquierda de este subgrupo, engen- 
dradas por la matriz M, representan, tanto una como otra, la clase 
de todas las matrices, cuyos determinantes son iguales al determi- 
nante de la matriz M: es suficiente recordar que al multiplicar las 
matrices se multiplican sus determinantes. 

A la definición de divisor normal expuesta anteriormente se le 
puede dar la forma siguiente: 

Un subgrupo A de un grupo G se llama divisor normal de este 
grupo, si para cada elemento z de G 


zA= Ar, (1) 


a cada elemento z de G y para cada elemento a de A, 
r en A unos elementos a” y a” tales que 


z 


decir, que p 
pueden ele 


za ax, az= za". (2) 


Se pueden indicar también otras definiciones de divisor normal, 
equivalentes a la inicial. Así, llamaremos conjugados a los elementos 
a y b del grupo G, si existe en G al menos un elemento z tal, que 


b= ax; B) 
suele decirse que b es el elemento transformado del elemento a median- 
te (o por) el elemento z. Es evidente, que de (3) se deduce la igualdad 
(5) bat, 


a= rbr’ 


Un subgrupo A del grupo G es un divisor normal de éste cuando, 
y sólo cuando, junto con cada uno de sus elementos a contiene también 
a todos los elementos conjugados del mismo en G. 
în efecto, si A es un divisor normal en G, entonces, en virtud de 
(2). para un elemento elegido a de A y para cualquier elemento z 
de G, se puede hallar en A un elemento a” tal, que 


ar= za. 


De aquí que 
rlar=4a, 


es decir, que cada elemento conjugado con a pertenece a A. Recípro- 

camente, si el subgrupo A, junto con cada uno de sus elementos a, 

contiene también todos los elementos conjugados con él, entonces, 
A contiene, en particular, al elemento 
alar=a", 

de donde se deduce la segunda de las igualdades (2). Por la misma 
causa, A contiene también al elemento 

(y ar? = zar 

de donde se deduce la primera de las igualdades (2). 
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Aplicando este resultado, es fácil demostrar que la intersección 
de cualesquiera divisores normales del grupo G también es un divisor 
normal de este grupo. En efecto, si A y B son divisores normales del 
grupo G, entonces, como se ha mostrado en el párrafo anterior, la 
intersección A fB representa un subgrupo del grupo G. Sea © un 
elemento cualquiera de A fB y sea z un elemento cualquiera del 
grupo G. Entonces, el elemento z"lez tiene que pertenecer tanto a .1 
como a B, puesto que ambos divisores normales contienen al ele- 
mento c. De aquí se deduce, que el elemento z"lez pertenece a la 
intersección A fB. 

Grupo cociente (o grupo factor) *. La importancia del concepto 
de divisor normal se debe a que, de un modo muy natural, con las 
clases adjuntas relativas a un divisor normal (en virtud de (1). 
se puede no hacer distinción entre las clases adjuntas a la izquierda 
y a la derecha), se puede formar un nuevo grupo. 

Obsérvese primero, que si A es un subgrupo arbitrario de un 
grupo G, se tiene, 


AAA, a) 


pues, el producto de dos elementos cualesquiera del subgrupo A 
pertenece a A y, por otra parte, multiplicando todos los elementos 
de A por la unidad, se obtiene ya todo el subgrupo A. 

Supongamos ahora que A sea un divisor normal del grupo G. 
En este caso, el producto de dos clases adjuntas cualesquiera, relativas 
al subgrupo A (en el sentido de multiplicación de subconjuntos del 
grupoG), representa también una clase adjunta respecto de A. En electo, 
aplicando la ley asociativa del producto de subconjuntos del grupo, 
la igualdad (4) y la igualdad 


yA Ay 


(compárese con (1)), entonces, para cualesquiera elementos z e y 
del grupo G, obtenemos: 


zA-yA=zyAA=2yA. (5) 


La igualdad (5) muestra que, para hallar el producto de dos 
clases adjuntas dadas del divisor normal A en el grupo G, se deben 
elegir on estas clases sendos representantes de un modo arbitrario 
(recordemos, que toda clase adjunta es engendrada por uno cual- 
quiera de sus elementos) y se debe tomar la clase que contenga al 
producto de estos representantes. 


A pesar de que el autor emplea solamente la denominación de grupo fac- 
tor, sin embargo, a continuación, utilizaremos la denominación de grupo cocien 
te, que es más corriente en castellano y que, por cierto, designa lo mismo. Véase 
la versión castellana de la obra de Birkhoff y MacLane «Algebra Moderna», 
traducida por R. Rodriguez Vidal, Editorial Teide, Barcelona, pág. 171. 
(Nota del. T.). 
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De este modo, en el conjunto de todas las clases adjuntas del 
divisor normal A en el grupo G, se ha definido una operación de 
multiplicar. Demostremos que, en este caso, se cumplen todas las 
condiciones inherentes a la definición de grupo. En efecto, la asocia- 
tividad de la multiplicación de las clases adjuntas se deduce de la 
asociatividad de la multiplicación de los subconjuntos del grupo. 
EL papel de la unidad lo desempeña el mismo divisor normal A, que 
representa una clase adjunta en la descomposición de G respecto 
de A: precisamente, en virtud de (4) y (1), para cualquier z de G, 
se tiene: 


zZA-A=a zA. 


Finalmente, el inverso para la clase adjunta zA es la clase adjunta 
TA, pues, 
ZA: 0IA=1.A=4. 


El grupo que hemos formado se denomina grupo cociente del gru- 
po G porel divisor normal A y se designa con la notación G/A. 

Vemos, pues, que con cada grupo se asocia toda una serie de 
grupos nuevos: sus grupos cocientes por diversos divisores normales 
Es comprensible que, en este caso, el grupo cociente del grupo 
por el subgrupo unidad es isomorfo al mismo grupo G. 

Todo grupo cociente GIA de un grupo abeliano G es también 
abeliano, puesto que de zy = yz se deduce que 


xA-y A 1yA=yrA=yA-zA. 


Todo grupo cociente G/A de un grupo cíclico G es también cíclico, 
puesto que si G es engendrado por el elemento g, G = {g}, y si so 
ha dado una clase adjunta arbitraria zA, existe un número entero k 


tal, que 
== 


zA = (gA)*. 


El orden de cualquier grupo cociente GIA de un grupo finito G es 
un divisor del orden del grupo mismo. En efecto, el orden del grupo 
cociente G/A es igual al índice del divisor normal A en el grupo G 
y, por eso, se puede aplicar la igualdad (7) del párrafo anterior. 

Veamos unos cuantos ejemplos de grupos cocientes. Como en el 
grupo aditivo de los números enteros, el subgrupo de los números 
que son múltiplos de un número natural Æ tiene el índice /e (véase el 
párrafo anterior), el grupo cociente de nuestro grupo por este sub- 
grupo es un grupo finito de orden 4 que, además, es cíclico, puesto 
que el mismo grupo considerado es cíclico. 


y por eso, 


27. 
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El grupo cociente del grupo simétrico S, de grado n por el grupo 
alternado A, de grado », es un grupo de 2° orden, que, como el núme- 
ro 2 es primo, representa un grupo cíclico (véase el final del párrafo 
precedente). 

Anteriormente habían sido descritas las clases adjuntas en el 
grupo multiplicativo de las matrices no degeneradas de orden n, 
cuyos elementos pertenecen a un campo P, relativas al divisor 
normal formado por las matrices cuyos determinantes son iguales a 1. 
De esta descripción se deduce que el grupo cociente correspondiente 
es isomorfo al grupo multiplicativo de los números del campo P 
que son diferentes de cero. 

Homomorfismos, Los conceptos de divisor normal y de grupo 
cociente están estrechamente ligados con la siguiente generalización 
del concepto de isomorfismo. 

Una aplicación p de un grupo G sobre mn grupo G’, que hace corres 
ponder a cada elemento a de G un elemento univocamente determi- 
nado a” -= aq de G’, so llama homomorfismo de G sobre G', si en esta 
aplicación cada elemento a” de G’ sirve de imagen de cierto elemen- 
toadeG,a' = ap, y si, para cualesquiera elementos a, b del grupo G, 


(ab) y = aq- by. 


Es obvio, que si se requiriese además que la aplicación y fuese 
biyectiva, obtendríamos la definición ya conocida de isomorfismo. 

Si q es un homomorfismo del grupo G sobre el grupo G’ y 1 y a son, 
respectivamente, la unidad y un elemento arbitrario del grupo G, 
siendo 1” la unidad del grupo G', se tiene: 


=t, 
ae = (agy'. 


En efecto, si 1p =e” y x’ es un elemento arbitrario del grupo 6”, 
entonces existe en G un elemento z tal, que zọ = z’. De aquí que 


ra =(21)p=ap Apre. 
De un modo análogo 


Fart 
y. por consiguiente, e = 1. 
Por otra parte, si (a)y =b', se 
Y —1p=(00) ẹ = ag- (0) y =aq-b” 
y, de un modo análogo, 


ne 


1=6-0p, 
de donde $} = (ap). 

Llamemos núcleo del homomorfismo q del grupo G sobre el 
grupo G’ al conjunto de los elementos del grupo G, a los que en la 


aplicación p corresponde la unidad 1” del grupo G’. 
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El núcleo de cualquier homomorfismo «p del grupo G es un divisor 
normal del grupo G. 

En efecto, si los elementos a, ò del grupo G pertenecen al núcleo 
del homomorfismo p, o sea, 


ay=bp=1", 
se tiene 
(ab) 9=aq-bp=1 4 =1", 
es decir, el producto ab también pertenece al núcleo del homo- 
morfismo q. Por otra parto, si ap= 1, se tiene 
g= (at == 40, 
es decir, a“! pertenece al núcleo del homomorfismo q. Por fin, 
ap=1' y z es un elemento arbitrario del grupo G, entonces 
(maz) = (5) 904-249 = (20)*- 121. 


En resumen, tenemos que el núcleo del homomorfismo considerado 
ropresenta un subgrupo del grupo G que, junto con cada uno de 
sus elementos, contiene tamb a los elementos conjugados; es, pues, 
un divisor normal. 

Sea, ahora, A un divisor normal arbitrario del grupo G. Haciendo 
corresponder a cada elemento z del grupo G la clase adjunta A, 
relativa al divisor normal A, a la que pertenece el mismo elemento, 
obtenemos una aplicación del grupo G sobre todo el grupo cociente 
GJA. De la definición de la multiplicación en el grupo G/A (véase (5)), 
se deduce que esta aplicación es un homomorfismo. 

El homomorfismo obtenido se llama homomorfismo natural 
del grupo G sobre el grupo cociente G/A. Es evidente, que el mismo 
divisor normal A sirve de núcleo de este homomorfismo. 

De aquí que los divisores normales del grupo G, y sólo ellos, sirven 
de núcleos de homomorfismos de este grupo. Este resultado se puede 
considerar como una definición más de divisor normal. 

Resulta que con los grupos cocientes del grupo G se agotan todos 
los grupos sobre los que puede aplicarse el grupo G de un modo 
homomorfo, y con los homomorfismos naturales sobre sus grupos 
cocientes se agotan todos los homomorfismos del mismo. Precisando, 
se verifica el siguiente 

Teorema de` los! homomorfismos. Supongamos que se haya dado 
un homomorfismo q del grupo G sobre el grupo G' y que A es el núcleo 
de este homomorfismo. Entonces, el grupo G' es isomorfo al grupo 
cociente GÍA, y además, existe una aplicación isomorja o del primero 
de estos grupos sobre el segundo tal, que el resultado de la realización 
consecutiva de las aplicaciones ọ y O coincide con el homomorfismo 
natural del grupo G sobre el grupo cociente GIA. 
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En efecto, sea z’ un elemento arbitrario del grupo G’, y z, un 
elemento tal del grupo G, que zp = z’. Como para cualquier elemen- 
to a del núcleo 4 del homomorfismo «p se verifica la igualdad 
ap = 1, se tiene 


(20) p=2q-ap=x2'-1" 


o sea, que todos los elementos de la clase adjunta zA se representan 
en q. por el elemento z’. 

Por otra parte, si z es un elemento cualquiera del grupo G tal, 
que zp = a”, se tiene 

(03) p =p q (ap) tep = ata", 

O sea, que z"lz pertenece al núcleo A del homomorfismo y. Poniendo 
z-z = a, so tiene z = za, o sea, el elemento z pertenece a la claso 
adjunta xA. Por consiguiente, reuniendo todos los elementos del 
grupo G que en el homomorfismo q se transforman en un elemento 
fijado z’ del grupo G’, obtenemos exactamente la clase adjunta xA, 

La correspondencia o que asocia a cada elemento 2” de G’ la clase 
adjunta del grupo G relativa al divisor normal A, que consta de 
todos los elementos del grupo G, que on la aplicación tienen por 
imagen a z’, es una aplicación biyectiva del grupo G” sobre el grupo 
G/A. Esta aplicación o es un isomorfismo, puesto que si 

o= rA, yo-yA, 


o sea, si 
p=, Y y, 
entonces, 
De ayy ay, 
(Uy) 0=2yA=xA-yA—=x'0+ 


Finalmente, si z es un elemento arbitrario de G y =p 
se tiene 


vo 


(29) 0 A, 

es decir, que en la realidad, la realización consecutiva del homomor- 
fismo q y del isomorfismo o hace corresponder al elemento z la clase 
adjunta zA engendrada por él mismo. El teorema queda demostrado. 


$ 66. Sumas directas de grupos abelianos 


Queremos acabar este capítulo con un teorema de la teoría de los 
grupos más profundo que aquellas propiedades elementales de los 
grupos que se habían expuesto anteriormente. A saber, basándose 
en la descripción de los grupos cíclicos, ya conocida por el $ 64. 
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obtendremos en el párrafo siguiente una descripción completa de los 
grupos finitos abelianos. 

Como está convenido en Ja teoría de los grupos abelianos, para 
la operación en el grupo se empleará la forma de expresión aditiva: 
se hablará de la suma a + 6 de los elementos a y b del grupo, del 
subgrupo nulo 0, de los múltiplos ka de cierto elemento a, etc, eto. 

En este párrafo examinaremos una construcción, cuya exposición 
va a estar adaptada para los grupos abelianos, a pesar de que podría 
sor presentada a la vez para grupos cualesquiera (aunque no fuesen 
conmutativos). Esta construcción está dictada por los ejemplos 
que siguen. El plano, considerado como un espacio lineal real de 
dos dimensiones, representa un grupo abeliano respecto a la suma de 
vectores. En este plano, cualquier recta que pase por el origen de 
coordenadas es un subgrupo del grupo indicado. Si A, y Az son dos 
rectas de éstas, entonces, como se sabe, todo vector que parte del 
origen de coordenadas se representa univocamente en forma de suma 
de sus proyecciones sobre las rectas A, y As. Análogamente, todo 
vector del espacio lineal de tres dimension: expresa unívocamente 
en forma de vna suma de tres vectores que pertenecen a tres rectas 
dadas 41, As, Aa, suponiendo que estas rectas no estén situadas en 
un plano. 

Se dice que un grupo abeliano G es una suma directa de sus sub- 
grupos Ay, Az, -a An 


G=Ary + Aat -t Año (1) 


si cada elemento x del grupo G se expresa, y además, unívocamente, 
en forma de una suma de elementos a, ds, » - -» ap tomados en los 
subgrupos A1, Ag, - +++ An, corrospondientemente: 


see Apo 2) 


z=a, 4 a, 


La expresión (1) se denomina descomposición directa del grupo G; 
los subgrupos As, i = 41, 2, .. ., k, se Haman sumandos directos de 
esta descomposición, y el elemento a; de (2), componente del elemento £ 
en el sumando directo A; de la descomposición (1), i = 1, 2, ..., k. 

Si se ha dado una descomposición directa (1) del grupo G, y si todos, 
o unos cuantos, sumandos directos A, de esta descomposición están tam- 
bién descompuestos en una suma directa 


Aj=An Ant po > ta B) 
entonces, el grupo G representa una suma directa de todos sus subgrupos 
PIE e E IMA 


En efecto, para un elemento arbitrario z del grupo G existe una 
expresión (2) respecto a la descomposición directa (1), y para cada 
27% 


422 Cap. XIV Grupos 


En efecto, sea z’ un elemento arbitrario del grupo G’, y z, un 
elemento tal del grupo G, que zp = z’. Como para cualquier elemen- 
to a del núcleo A del homomorfismo q se verifica la igualdad 
ap = 1, se tiene 

(za) p=2q-ap= r =r, 


o sea, que todos los elementos de la clase adjunta zA se representan 
en q por el elemento 2”. 

Por otra parte, si z es un elemento cualquiera del grupo G tal, 
que zp = z’, se tiene 

(22) =p 29 (24) 

o sea, que z"lz pertenece al núcleo A del homomorfismo q. Poniendo 
arta = a, se tiene z = za, o sea, el elemento z pertenece a la clase 
adjunta z4. Por consiguiente, reuniendo todos los elementos del 
grupo G que en el homomorfismo q se transforman en un elemento 
fijado z’ del grupo G’, obtenemos exactamente la clase adjunta zA. 

La correspondencia o que asoc: ada elemento z” de G” la clase 
adjunta del grupo G relativa al divisor normal A, que consta de 
todos los elementos del grupo G, que en la aplicación y tienen por 
imagen a z’, es una aplicación biyectiva del grupo G’ sobre ol grupo 
G/A. Esta aplicación es un isomorfismo, puesto que si 

z'a= zA, yo-—yA, 


yat, 


o sea, si 
E ypy’, 
entonces, 
(zy) p= reyp ry’, 
(Uy) o=xyA=zA-yA=2x'0-y'0, 


Finalmente, si z es un elemento arbitrario de G y 2q- 
se tiene 
(1) 0=x0=xA, 
es decir, que en la roalidad, la realización consecutiva del homomor- 


fismo q y del isomorfismo o hace corresponder al elemento z la clase 
adjunta z4 engendrada por él mismo. El teorema queda demostrado. 


$ 66. Sumas directas de grupos abelianos 


Queremos acabar este capítulo con un teorema de la teoría de los 
grupos más profundo que aquellas propiedades elementales de los 
grupos que se habían expuesto anteriormente. A saber, basándose 
en la descripción de los grupos cíclicos, ya conocida por el $ 64, 
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Un grupo abeliano G representa una suma directa de sus subgrupos 
Ar Az, - - -+ An cuando, y sólo cuando, el mismo es engendrado por 


estos subgrupos, 
G=(4,, An ++: Ar), (6) 


y la intersección de cada subgrupo As, i = 2, . . ., k, con el subgrupo 
engendrado por todos los subgrupos anteriores Ay, Az, .. n Ai-i» 
contiene solamente al cero, 

{án An +1 Ar N A=, caps (1) 


En efecto, si el grupo G posee una descomposición directa (1), 
entonces, para cada elemento z de G existe una expresión (2) y, por 
esto, se verifica la igualdad (6). El cumplimiento de la igualdad 
(7) es consecuencia de la unicidad de la expresión (2) para cualquier 
elemento x: si para cierto i, la intersección (Aj, Az, - + «+ Ar) N 
NA; contuviese un elemento z no nulo, entonces, por una parte, £ 
se podría expresar como un elemento a; de Aj, 0 sca, = = 41, y por 
eso 


z=0+... 040404... 0; (8) 


por otra parte, z, como elemento del subgrupo {Ar As, -- +, 41) 


posce una expresión de la forma 
z=} at.. F t 


o sea, 
arado Ham tHO+ H0. (9) 


evidente, que para el elemento z, (8) y (9) son dos expresiones 
intas de la forma (2). 

Recíprocamente, supongamos que se cumplen las igualdades (6) 
y (1). De (6) se deduce, que cualquier elemento z del grupo G posee 
por lo menos una expresión de la forma (2). Por otra parte, suponga- 
mos que para cierto elemento existen dos expresiones distintas 
de la forma (2) 


ë 


E E E A A T A ao 


ar tal i, i<k, que 


Entonces, se puede ha 


hs Ap = dy 1 (11) 
pero 
att, 
o sen, 
=a +0. (12) 


Sin embargo, de (9) y (11) se deduce la igualdad 


a —aj (0 —a) + (04) 4... + (0-1 — 1-4), 
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que, en virtud de (12), contradice a la igualdad (7). El teorema queda 
demostrado. 

El concepto de suma directa se puede examinar de otro modo 
tinto. Sean dados Æ grupos abelianos arbitrarios Ay, As, ++, Año 
algunos de los cuales pueden ser isomorfos. Designemos con G el 


conjunto de todos los si les de la forma 
(ais Ao, ---, 04), (13) 


Arc Ario Ah El 
suma de los 


formados por sendos elementos de los grupo 
conjunto G se convierte en un grupo abeliano, si la 
sistemas de la forma (13) se define por la regla: 


(ar, an as an) + (ai, 4) 

a+ aj, labia + ar tah), (14) 
según la cual se suman los elementos de los grupos dados A4, As, +. + 
+. e An por separado. En efecto, las leyes asociativa y conmuta- 


tiva de esta suma se deducen del cumplimiento de estas leyes en 
cada uno de los grupos dados; el papel del cero lo desempeña el sistema 


(01, Oz, +... 04), 
donde mediante 0, se señala el elemento nulo del grupo Ar 


1,2,...,k; el elemento opuesto para el sistema (13) es el 
sema 


(—44 — as «y — ar). 


El grupo abeliano G construido se llama suma directa de los 
grupos Ay, Az, . + An y se designa, como anteriormente, mediante 


G=A,-+ 4: 


La razón de esta denominación consiste en que el grupo G, que re- 
presenta una suma directa de los grupos Ay, Az, . + ., An en el sentido 
que acabamos de definir, se puede descomponer en una suma directa de 
sus subgrupos Aj, A;, +...) Ah, que son isomorfos a los grupos 
As, Az, -.., An, correspondientemente. 

Designemos, para esto, mediante ¿4,2 ....k, el 
conjunto de los elementos del grupo G, o sea, de los sistemas de la 
forma (13), en los que en el lugar de ¿ figura un elemento arbitrario a; 
del grupo A;, y en los demás lugares, los ceros de los grupos corres- 
pondientes; éstos son, por consiguiente, los sistemas de la forma 


(01, -~x Or 01). (15) 


La definición de la suma (14) muestra que el conjunto Af representa 
un subgrupo del grupo G; el isomorfismo de este subgrupo con el 
grupo A; se obtiene haciendo corresponder a cada sistema (15) el 
elemento a; del grupo Aj. 


Ar. 


> Ah Onn- 
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Queda por demostrar que el grupo G representa una suma directa 
de los subgrupos Aj, Aj, ..., Ak En efecto, cualquier elemen- 
to (13) del grupo G se puede representar en forma de una suma de 
elementos de los subgrupos indicados: 


(41, Az, +=, aa) = (05, Oz, +- -s 01) + 
+(01, Az, Os,- 04) + (01, 02, -.-1 01-15 an). 
La unicidad de esta representación se deduce de que diferentes 
sistemas do la forma (13) son dilerentes elementos del grupo G. 
Si se han dado dos sistemas de grupos abelianos, A, A 
y Bı, Bz, ..., Bu, y los grupos Ay y Bi, ds 
morfos, entonces los grupos 
G=A+ 4+ 


tAr 


y 
H=B, +B2+...+Bx 
también son isomorfos. 

En efecto, si para ¿ =1,2,..., k, se ha establecido un iso- 
morfismo «p, entre los grupos A; y B; que hace corresponder a cada 
elemento a; de A; el elemento aq; de B;, entonces es evidente, que 
la aplicación œ que a cada elemento (8, az, .. ., an) del grupo G 
asocia el elemento del grupo A determinado por la igualdad 

(an da +09) P= (UP Aafa << OPa), 
es un isomorfismo que aplica al grupo G sobre el grupo J. 

Si se han dado los grupos abelianos finitos Ay, Az, .. ., Am 

cuyos órdenes correspondientes son M1, Ra, ..., ny, entonces la suma 


directa G de estos grupos es también un grupo finito y su orden n es 
igual al producto de los órdenes de los sumandos directos, 
nens -s ny- (16) 

En efecto, el número de sistemas diversos de Ja forma (13), para 
cada uno de los cuales el elemento a, puede tomar n; valores distin- 
tos, el elemento az, Loma x valores distintos, etc. se determina por 
la igualdad (16). 

Veamos unos cuantos ejemplos. 

Si el orden n de un grupo cíclico finito (a) se descompone en un 
producto de dos números naturales que son primos entre sí, 


n=st, (s, t)=1, 


entonces, el grupo {a} se descompone en una suma directa de dos grupos 
cíclicos, cuyos órdenes correspondientes son s y t. 
Para el grupo (a) emplearemos la expresión aditiva. Poniendo 
b = ta, se tiene 
sb =(st)a=na =0, 
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pero, para 0< k <s, 
kb=(kt)a #0, 


es decir, el subgrupo cíclico {b} tiene el orden s. Análogamente, el 
subgrupo cíclico {e} del elemento c = sa tiene el orden £. La inter- 
sección {b} f (c) contiene sólo el cero, puesto que si kb = le para 
O<k<s, 0<I<t, entonces 


(Ke) a=(1s) a, 
y como los números kt y ls son menores que n, se tiene 
k 


E 


lo cual es imposible, ya que los números s y £ son primos entro sí. 
Finalmente, existen unos números u y v tales, que 


su to= 
y, por lo tanto, 
v (ta) + u (sa) =vb-+ ue, 


y, por consiguiente, cualquier elemento del grupo (a) se puede 
representar como una suma de elementos de los subgrupos {b} y {c}. 

Llamaremos a un grupo abeliano G indescomponible, si no puede 
ser descompuesto en una suma directa de dos o de unos cuantos 
subgrupos, diferentes del subgrupo cero. Un grupo cíclico finito, 
cuyo orden es una potencia de wn número primo p, se denomina 
grupo cíclico primario respecto al número primo p. Aplicando unas 
cuantas veces la proposición demostrada anteriormente, obtenemos, 
que todo grupo cíclico finito se descompone en una suma directa de 
grupos cíclicos primarios, respecto a diversos números primos. Más 
exactamente, todo grupo cíclico de orden 


Ps 


donde Pi, Pz, . . ., Ps Son números primos distintos, se descompone en 
una suma directa de s grupos cíclicos que tienen los órdenes pit, pts, ... 
+=, Pls, respectivamente. 

Todo grupo cíclico primario es indescomponible. 

En efecto, sea dado un grupo cíclico finito (a) de orde:. pt, 
donde p es un número primo. Si este grupo fuese descomponible, 
entonces, en virtud de (7), tendría subgrupos diferentes de cero, 
la intersección de los cuales sería igual a cero. Sin embargo, en la 
realidad, todo subgrupo diferente de cero contiene el elemento dife- 
rente de cero 


n= pm" 


b= pa. 
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Para la demostración, tomemos un elemento arbitrario z diferente 
de cero de nuestro grupo, 


ase, 0<s<p'. 
El número s se puede escribir en la forma 
s=pls, 0 <I<k, 
donde el número s ya no es divisible por p y, por consiguiente, éstos 


son primos entre sí, debido a lo cual, existen unos números u y v 
tales, que 


s'u + po 


Entonces, 
(pu) z= (pus) a = pus”) a 
p (4 — pw) a = (p — pro) a = pl Ya —v (p'a) = p-ta = b, 


o sea, el elemento b pertenece al subgrupo cíclico {2}. 

El grupo aditivo de los números enteros (o sea, el grupo ciclico 
infinito), y también el grupo aditivo de todos los números racionales, 
son grupos indescomponibles. 

Ésto se deduce de que en cada uno de estos grupos, para cual- 
quier par de elementos diferentes de cero, existe un común múltiplo 
diferente de coro, es decir, dos subgrupos cóclicos cualesquiera, 
diferentes de cero, tienen una intersección diferente de cero. 

Obsérvese que, si en el grupo abeliano G la operación se llama 
multiplicación, entonces, se debe hablar del producto directo y no de 
la suma directa. 

El grupo multiplicativo de los números reales diferentes de cero 
se descompone en un producto directo del grupo multiplicativo de los 
números reales positivos y del grupo formado por los números 1 y —1, 
respecto a la multiplicación. 

En efecto, a la intersección de Jos dos subgrupos indicados de 
nuestro grupo pertenece solamente el número 1, que es el elemento 
unidad de este grupo. Por otra parte, todo número positivo es igual 
al producto de sí mismo por el número 1, todo número negativo 
es igual al producto de su valor absoluto por el número —1. 
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Tomando cualquier conjunto finito de grupos cíclicos primarios, 
algunos de los cuales pueden estar referidos a un mismo número 
primo, o incluso pueden tener un mismo orden, o sea, que 
pueden ser isomorfos, la suma directa de ellos representa un grupo 
abeliano finito. Resulta, que con esto se agotan todos los grupos 
abelianos finitos: 


28- 
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Teorema fundamental de los grupos abelianos finitos. Todo 
grupo abeliano finito G que no es un grupo cero, se descompone en una 
suma directa de subgrupos cíclicos primarios. 

Comenzaremos la demostración de este teorema observando que 
en el grupo G, indispensablemente, existen elementos diferentes de cero, 
cuyos órdenes son potencias de números primos. En efecto, si un elemen- 
to z del grupo G, diferente de cero, tiene el orden Z, iz- O. y 
p“. k >0, es una potencia del número primero p tal, que el número /. 

l= p"m, 


es divisible por ella, entonces, el elemento mz es diferente de coro 
y tiene el orden p“. 
Sean 


(1) 


Pr P: 


todos los números primos diversos, algunas de cuyas potencias sirven 
de órdenes de algunos elementos del grupo G. Designemos con p 
cualquiera de estos números, y con P, el conjunto de los elementos 
del grupo G, cuyos órdenes son potencias del número p. 

El conjunto P representa un subgrupo del grupo G, En efecto, 
P contiene al elemento 0, ya que su orden es igual a 1 — p°. Por 
otra parte, si p'x= 0, entonces, p“ (—2) = 0. Finalmente, si 
pix 0, p'y =0, y si, por ejemplo, k£>1, entonce 


p" (z+y)=0, 


o sea, el orden del elemento z + y, o bien es el número p*, o bien 
es un divisor de este número, es decir, es una potencia del núme- 
ro p. 


'omando, por p cada uno de los números (1), sucesivamente, 
obtenemos s subgrupos no nulos, 


Pa Paco Pas (2) 
El grupo G es una suma directa de estos subgrupos, 
G=Pi+Pa+...+Pa (3) 


En efecto, si z es un elemento arbitrario del grupo G, su orden / 
sólo puede dividirse por ciertos números primos del sistema (1), 


donde k; >0, ¿=1, 2, . . ., s. Por eso, como se había demostrado 
al final del párrafo anterior, el subgrupo cíclico {z} se descompone 
en una suma directa de subgrupos cíclicos primarios que tienen los 
órdenes při, pla, ..., pis respectivamente. Estos subgrupos cícli- 
cos primarios pertenecen a los subgrupos (2) correspondientes y, por 
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consiguiente, el elemento x se representa en forma de una suma de 
elementos, tomados uno por uno en todos o en unos cuantos de los 
subgrupos (2). De este modo, queda demostrada la igualdad 


G= (Ps Po... Pa}, 
que es análoga a la igualdad (6) del párrafo anterior. 
Para demostrar la igualdad, análoga a la igualdad (7) del mismo 


párrafo, tomemos cualquier ¿, 2<¿<s. Entonces, cualquier elemento 
y del subgrupo (Ps, Pa, ..., Pi} tiene la forma 


Y=O a+... Ha- 


donde el elemento aj, j — 1, 2, ..., ¿ — 1, pertenece al subgrupo 
P), es decir, tiene el orden p)/. Entonces, 


(pz... pri) y=0, 


o sea, el orden del elemento y es 


o to divisor del número p'ap}? .... 
P, ES y, por consiguiente, el elemento y, si es diferente de cero, 


no puede pertenecer al subgrupo P;. De este modo, queda demostra- 
do, que 


(Ps Paso, Pis) N PO, 


que es lo que se quería demostrar. 

Obsérvese que el grupo abeliano en el que los órdenes de todos los 
elementos son potencias de un mismo número primo p, se denomina 
primario respecto del número p. Los grupos cíclicos primarios son 
casos particulares de los grupos primarios. Por lo tanto, los snb- 
grupos (2) son primarios. Éstos se llaman componentes primarios del 
grupo G, y la descomposición directa (3), descomposición de este 
grupo en componentes primarios. Como los subgrupos (2) están deter- 
minados unívocamente en el grupo G, la descomposición del grupo G 
en componentes primarios se determina univocamente. 

Es comprensible, que la descomposición de todo grupo abeliano 
finito en una suma directa de grupos primarios reduce la demostración 
del teorema fundamental al caso de un grupo abeliano finito primario 
P, respecto de cierto número primo p. Examinemos este caso, 

Sea a, uno de los elementos del grupo P que tienen en éste el 
orden máximo. Si, luego, existen en el grupo P elementos, diferentes 
de cero, las intersecciones de cuyos subgrupos cíclicos con el subgrupo 
cíclico (a,) son iguales a cero, entonces, mediante as indicamos uno 
de los elementos de orden máximo entre los elementos que poseen 
esta propiedad; por lo tanto, 


tas) N la) =0. 


28+ 
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Supongamos que ya se han elegido los elementos 44, 27, . .., di. 
El subgrupo del grupo P, engendrado por sus subgrupos cíclicos, 
lo indicaremos mediante” (Aj, da, .-.. 4/1), 


(as), taa) -s (a) = tan aa + ia) Q 


Es evidente, que éste se compone de todos los elementos del grupo P 
que se pueden expresar en forma de una suma de elementos, múlti- 
plos de los elementos aj, 42, . ... 2,13 diremos que este subgrupo 
está engendrado por los elemento a. Designemos 
ahora con a; uno de los elementos de orden máximo entre los elemen- 
tos del grupo P, las intersecciones de cuyos subgrupos cíclicos con el 
subgrupo (41, de, - .-., ai} son iguales a cero; por lo tanto, 


fu, a yN la) =0. (5) 


Coma el grupo P es finito, este proceso tendrá fin; supongamos 
que esto ocurre después de que se han elegido los elementos 
di az... 0% Mesignando con P el subgrupo engendrado por 
estos elementos, 


roai 


P'= {an an o), 


P= Kah Ade fash (6) 


so tiene que el subgrupo cíclico engendrado por cualquier elemen- 
to del grupo P, diferente de cero, tiene con el subgrupo P” una 
intersección no nula. 

En virtud de (4), la igual 


o sea, 


a igualdad (5), que se veri- 
fican para ¿i 2,3, .... S. om que el subgrupo P’ es una 
suma directa de los subgrupos cíclicos {a,}, (42) , .... {0}, 

PO fa) (a) +... as) (7) 
Queda por demostrar que el subgrupo P” coincide en la realidad 


con todo el grupo P. 
Sea x un elemento cualquiera del grupo P que tenga el orden p. 


Como 


P N {r}, 


y el subgrupo {x} no tiene subgrupos no nulos, diferentes de sí mismo 
(recordemos, que el orden de un subgrupo es divisor del orden del 
grupo, y que el número p es primo), el subgrupo {z} verdaderamente 
está contenido en el subgrupo P” y, por consiguiente, z pertenece a 
P*. Por lo tanto, todos los elementos de orden p del grupo P pertene- 
cen al subgrupo P”. 

Supongamos que ya está demostrado que al subgrupo P” pertene- 
cen todos los elementos del grupo P, cuyos órdenes no son mayores 
que el número p'=l, y sea z un elemento cualquiera de P de orden p?. 
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Como muestra la elección de los elementos 41, dz, . . ., as, el orden 
de éstos no va creciendo y, por esto, se puede señalar tal i, 
1<i—4<s, que los órdenes de los elementos a, as, +, 4 
son mayores o iguales a p*, y para i — 1 < s, el orden del elemento 
a, es estrictamente menor que este número, es decir, es menor que el 
orden del elemento z. En virtud de las condiciones a que está ajusta- 
da Ja elección del elemento a;, de aquí se deduce que, si 


Q= (ar a, 
00170. 


Sin embargo, en el párrafo anterior se había demostrado que 
todo subgrupo no nulo de un grupo cíclico primario {£} de orden p* 
contiene el elemento 


Cid, 
entone 


y pz. (8) 


Por consiguiente, este elemento y pertenece a la intersección Qf 
Nte). y. por lo tanto, al subgrupo Q. Esto da la posibilidad de 
expresar y en forma de una suma de elementos, múltiplos de los 
elementos aj, Br, ajai 


y= ha y dat lia ©) 
De (8) se deduce, que el elemento y tiene el orden p. Por eso, 
(pl) ay (plo) az hdi) ia = 0, 


o sea, que en virtud de la existencia de Ja descomposición 
directa (7), 


(Pipay -M 304,2, ¿1 


Por lo tanto, el número pl, tiene que se por el orden del ele- 
mento aj, y por esto, también por el número p“, de donde se deduce 
que 2, se divide por pS, 


lj- pm, j=1, 2 ¿1 (10) 
Sea 
2 ma, Ms ... +m; 


Este elemento pertenece al subgrupo Q 
subgrupo P’; además, en virtud de (9) y (10), 


y pz. (14) 
De (8) y (11) se deduce la igualdad 
p(«—2)=0, 


es decir, que el orden del elemento 


' consiguiente, al 
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no es mayor que p** y, por consiguiente, en virtud de la hipotesis 
de la inducción, £ pertenece al subgrupo 2”. Por esto, el elemento z, 
como suma de dos elementos de P”, z — z -+ t, también pertenece al 
subgrupo P”, De este modo, queda demostrado que todos los elemen- 
tos de orden p* del grupo P pertenecen a P’. Por consiguiente, 
nuestra demostración por inducción da Ja posibilidad de afirmar 
que todos los elementos del grupo P pertenecen al subgrupo P”, o sea, 
que P” — P. La demostración del teorema fundamental está terminada. 

Como resultado complementario, obtenemos que un grupo abelia- 
no finito es primario respecto al número primo p, cuando, y sólo cuando, 
su orden esuna potencia de este número p. En electo, se había demos- 
trado que todo grupo abeliano finito P que es primario (respecto a p), 
se descompone en una suma directa de grupos cíclicos primarios (res- 
pecto a p), y por eso, el orden del grupo P es igual al producto de los 
órdenes de estos grupos cíclicos, o sea, es una potencia del número p. 
Recíprocamente, si el orden de un grupo abeliano finito es igual 
a p", donde p es un número primo, entonces, el orden de cualquiera 
de sus elementos es divisor de este número, es decir, también es una 
potencia del número p, y, por lo tanto, el grupo resulta ser prima- 
rio respecto a p. 

Con el teorema fundamental no se agota todavía el problema de 
la descripción total de los grupos abelianos finitos, puesto que toda- 
vía no se ha excluido la posibilidad de que las sumas directas de 
dos conjuntos distintos de grupos cíclicos, primarios respecto a cier- 
tos números primos, sean grupos isomorios. En la realidad esto 
no se verifica, como muestra el teorema que sigue: 

Si, de dos modos distintos, se ha descompuesto un grupo abeliano 
finito G en una suma directa de subgrupos cíclicos primarios, 


Cta) + la)+ (a) =(0) 41094 + (0), (12) 


entonces, ambas descomposiciones directas poseen el mismo número 
de sumandos directos, s= t, y entre los sumandos directos de estas 
descomposiciones se puede establecer una correspondencia biunívoca 
tal, que los sumandos correspondientes sean grupos cíclicos de un mismo 
orden, es decir, isomorfos. 

Observemos primero, que si tomamos en la primera de las descom- 
posiciones directas (12), por ejemplo, los sumandos directos que se 
relacionan al número primo dado p, su suma directa será un subgrupo 
primario (respecto a p) del grupo G, e incluso componente primaria 
de este grupo, puesto que su orden es igual a la potencia máxima 
del número p por la que se divide el orden del grupo G. Reuniendo 
de este modo todos los sumandos directos en cada una de las descom- 
posiciones (12), obtenemos en ambos casos la descomposición del 


grupo G en componentes primarias, cuya unicidad ya fue señalada 
anteriormente. 


$ 67. Grupos abelianos finitos 435 


Esto nos permite demostrar el teorema, suponiendo que el mismo 
grupo G es primario respecto al número primo p. Sea elegida Ja nume- 
ración de los sumandos directos en cada una de las descomposicio- 
nes (12) de tal modo, que los órdenes de estos sumandos no vayan cre- 
ciendo. es decir, que teniendo los elementos &;, da, + --, 2, 10s 
órdenes 


PA, A p 
respectivamente, sea, 
kdk + dku 


y teniendo los elementos by, Da, ..., by los Órdenes 


P" 


a Pa. 


respectivamente, sea, 
L>l>...>h. 


Si no se cumpliese la tesis de nuestro teorema, se hallaria un 
i51, tal, que 


te (13) 


ki li 


Está claro, que i< min (s, 1), puesto que para cada una de las 
descomposiciones (12), el producto de los órdenes de todos los 
sumandos directos es igual al orden del grupo G. Mosiremos que 
nuestra suposición nos lleva a una contradicción. 

Sea, por ejemplo, 


ki bio (14) 


Designomos con /7 el conjunto de los elementos del grupo G cuyos 
órdenes no sobrepasan a 4%. Este representa un subgrupo del gru- 
po G, puesto que si z e y son elementos de //, entonces, 2 | y y 
son de orden no supe: número při, 


Obsérvese, que bgrupo 4 pertenecen, en particular, los 
elementos siguientes: 
pta, pas, ..., Pp Mato Mis jp << ao 


Por otra parte, si 1<j-<i —1, entonces, el orden del elemento 
pay es igual a p*it!, y por eso, no pertenece a H. De aquí se 
deduce, que la clase adjunta a, + H (irecordemos, que estamos 
empleando la expresión aditiva!) tiene, como elemento del grupo 
cociente G/H, el orden p'7*; este mismo orden tiene su subgrupo 
cíclico (a; H}. Demostremos que el grupo G/1/ es una suma direc- 
ta de los subgrupos cíclicos (a+ H} j= 1,2, a ¿—% 


GIH =4a +1) +ar + H) +4 (a me (15) 
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y que, por esto, su orden es igual al 
¿IIED HA) ors 


P 


zes un elemento 


(16) 


e la expre- 


rbitrario del grupo G, exis 


z oma, Foes PMA 


Supongamos que, para j 
m; 


donde 


D 07) 


Entonces, 
majo qe aj) -njaj 
y como el primer sumando del segundo miembro está contenido 
en JE, se tiene 
mja; Monja i H. 
Por otra parte, 
ma: H-H, .. mas H H, 
bor eso, 
x- H- (ma, i H) (mas H)+... © (ma, H) 
(nn i H) (naas i Hya r (iati +H) (18) 
Supongamos que existe una expresión más de éstas, 
z- H- (nja, Y A (nas i Hyn at) (19) 
donde 


Ocna pr", j=1, (20) 
Entonces, los elementos 
nahn Mil 


x 


nit + ngat AT TEN 


están en una misma clase adjunta relativa a /f, o sea, su dife- 
rencia pertenece a H y, por esto, 


p"! (m — ni) a, + (125) az + 


De aqui se deduce (ya que la primera de las descomposiciones 
(12) es directa) que 


p" (nj—ni)a;=0, ¡4,2 0, ¿—1, 


(M1 —n41) 414) =0 
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y. por lo tanto, el número pl! (n; — nj) tiene que dividirse por el 
orden p*j del elemento a, y, por consiguiente, la diferencia n; — nj 
se divide por el número p'37%. En virtud de (17) y (20), de aquí se 
deduce que 


nyon ¡=4, 


es decir, las expresiones (18) y (19) son idéntic: te modo, 
queda demostrada la existencia de la descomposición directa (15). 

Consideraciones análog: lizadas para la segunda de las 
descomposiciones (12), muestran que este mismo grupo cociente 
GIH posee una descomposición directa 


GIH =4b, MY A da Y a A AAA HYH oo 


es decir, que en virtud de (13) y (14), su orden tiene que ser estric- 
tamente mayor que el número (16). Esta contradicción demuestra 
el teorema. 

Ya hemos obtenido una exposición completa de los grupos abelia- 
nos finitos. Así, pues, tomamos todos los conjuntos finitos posibles de 
números naturales 


ON 


diferentes de la unidad, pero no indispensablemente distintos, de modo 
que cada uno de ellos sea una potencia de cierto número primo. A cada 
conjunto de éstos ponemos en correspondencia una suma directa de 
grupos cíclicos, cuyos órdenes sean iguales a los números de este conjunto. 
Todos los grupos abelianos finitos obtenidos de este modo, resultan ser 
no isomorfos dos a dos, y cualquier otro grupo abeliano finito es iso- 
morfo a uno de estos grupos. 
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